Імпорт і аналіз даних у Google Sheets: витягнення частини рядка

Імпорт і аналіз даних у Google Sheets: витягнення частини рядка

4 Березня 2024 в 16:00 29

У сучасному світі величезна кількість інформації зберігається в Інтернеті. Google Sheets, як популярний інструмент для обробки даних в хмарі, дозволяє імпортувати дані з інших джерел для подальшого аналізу та використання. Однак іноді отримані дані потребують додаткового оброблення перед тим, як їх можна буде використовувати для потрібних обчислень або візуалізацій.

У цій статті ми розглянемо конкретну задачу: витягнення певної частини рядка з отриманих даних у Google Sheets. Для цього ми використовуватимемо функцію IMPORHTML для імпорту даних з веб-сторінки та рядок формули, що використовує різні функції Google Sheets для аналізу тексту та витягнення потрібної інформації.

Припустимо, що ми маємо веб-сторінку, яка містить таблицю з даними про котирування фінансових інструментів. Однією з цікавих нам метрик є процентна зміна, яка вказується разом з числовим значенням у дужках, наприклад, “‘0.72 (13.28%)'”. Нашою метою є витягнення самого числового значення (у цьому випадку або 0.72, або 13.28) для подальшого аналізу.

Для цього ми використовуємо формулу, яка включає кілька функцій:

Ця формула робить наступне:

  1. Функція IMPORHTML імпортує дані з веб-сторінки, вказаної у першому аргументі. У нашому випадку ми використовуємо веб-адресу з параметром, який можна змінювати (наприклад, t=E14).
  2. Функція INDEX повертає значення з вибраної комірки у відповідності з переданими аргументами. У нашому випадку ми отримуємо значення з восьмого рядка та другого стовпця таблиці, яку імпортуємо.
  3. Функція SUBSTITUTE видаляє з рядка певні символи або текст, які передаються в аргументах. У даному випадку ми видаляємо всі символи, що знаходяться між одиночними кавичками.

Результатом виконання цієї формули буде текстове значення у форматі “‘0.72 (13.28%)'”. Однак, оскільки значення може варіюватися за довжиною, нам потрібно витягнути саме числову частину для подальшого аналізу.

Для витягнення числової частини рядка можна використати функцію MID, яка поверне певну кількість символів з середини рядка, вказану у другому та третьому аргументах. У нашому випадку формула буде наступною:

Ця формула витягне частину рядка, починаючи з другого символу і до четвертого, тобто у нашому випадку вона поверне “0.72”.

Таким чином, використання функцій Google Sheets, таких як IMPORHTML, INDEX, SUBSTITUTE та MID, дозволяє ефективно імпортувати дані з Інтернету та витягувати певні частини рядків для подальшого аналізу та використання.