У світі аналітики та обробки даних Python став однією з найпопулярніших мов програмування, завдяки своїм потужним інструментам та бібліотекам. Його можливості роблять його ідеальним вибором для автоматизації рутинних завдань, таких як оновлення даних в таблицях Excel. У цій статті ми розглянемо конкретну задачу – обчислення та оновлення значень стовпця Total в Excel, використовуючи мову програмування Python.
Перш ніж перейти безпосередньо до реалізації цієї задачі, давайте розглянемо постановку проблеми. Ми маємо набір даних, представлений у вигляді таблиці зі стовпцями AGE та INCOME:
1 2 3 4 5 6 |
AGE, INCOME 32, 50,000 34, 55,000 32, 43,000 32, 48,000 34, 38,000 |
Наша мета – розрахувати та оновити значення стовпця Total, який відображає загальний дохід для кожного віку. Наприклад, для віку 32 потрібно обчислити суму всіх значень INCOME, де AGE = 32, і внести це значення відповідно до віку 32 у стовпець Total. Те ж саме треба зробити для віку 34.
Для досягнення цієї мети ми будемо використовувати Python та деякі з його потужних бібліотек, таких як pandas та openpyxl. Спочатку ми завантажимо дані з Excel у pandas DataFrame, а потім виконаємо необхідні обчислення та оновимо значення у стовпці Total. Нарешті, ми збережемо оновлені дані назад у файл Excel.
Давайте розглянемо кожен крок процесу більш детально:
Тепер давайте перейдемо до коду, який реалізує ці кроки:
1 2 3 4 5 6 7 8 9 10 11 12 |
import pandas as pd from openpyxl import load_workbook # Завантаження даних з Excel df = pd.read_excel('data.xlsx') # Обчислення значень для стовпця Total total_values = df.groupby('AGE')['INCOME'].sum() # Оновлення даних у файлі Excel wb = load_workbook('data.xlsx') ws = wb.active for age, total in total_values.items(): ws.cell(row=df[df['AGE'] == age].index[0]+2, column=df.columns.get_loc('Total')+1, value=total) wb.save('data.xlsx') |
Цей код завантажує дані з файлу Excel, обчислює значення для стовпця Total та оновлює дані у файлі Excel з оновленими значеннями у стовпці Total.
В цій статті ми детально розглянули процес автоматизації оновлення даних в Excel за допомогою мови програмування Python. Цей підхід дозволяє ефективно та швидко оновлювати великі обсяги даних у таблицях Excel, зменшуючи час та зусилля, витрачені на ручне оновлення.