Создание сводной таблицы Excel на основе внешних источников данных

Никто не спорит, что программа Excel является прекрасным средством обработки и анализа данных. По сути, сводные таблицы сами по себе являются доказательством аналитической мощи Excel. Однако, говоря обо всех достоинствах программы, нельзя не упомянуть и об одном существенном упущении. Программа Excel построена на относительно простой платформе управления данными, обладающей тремя недостатками.

  • Размер набора данных сильно влияет на скорость обработки данных в сводной таблице. Это накладывает серьезные ограничения на эффективность использования сводных таблицы как самодостаточных структур. Причина подобного поведения программы — в специфике управления оперативной памятью. При открытии файла в Excel он полностью заносится в оперативную память для более быстрой обработки и доступа к данным. Но при всем этом в программе не обеспечен надежный механизм оптимального управления оперативной памятью при извлечении из нее даже небольшого фрагмента данных. Несмотря на то что в Excel 2010 предусматривается использование до 1 млн строк и 16 000 столбцов, даже средние по размеру наборы данных приводят к значительным задержкам при обработке их информации.
  • Отсутствие реляционной модели данных вынуждает нас использовать плоские таблицы, которые хранят избыточные данные и увеличивают шанс появления ошибок.
  • Отсутствие индексации полей данных в Excel для оптимизации процесса извлечения больших объемов данных.

Именно поэтому в серьезных организациях управление данными осуществляется не с помощью Excel. Изначально оно реализуется в таких СУБД, как Microsoft Access и SQL Server. Эти СУБД используются для хранения миллионов записей, которые можно быстро находить и извлекать. Эффект такого разделения производственных задач заключается в существовании уровня управления данными (сама база данных) и уровня приложения (программа Excel). Трудность заключается в том, чтобы найти наилучший способ извлечения информации из уровня управления данными и передачи ее на уровень приложения для эффективного использования в сводной таблице.

Управление данными — это основная операция, осуществляемая в рамках проекта по созданию сводных таблиц и анализу информации в них. Внешние источники данных максимально приспособлены для создания на их основе сводных таблиц большого размера. Это означает, что Excel прекрасно справляется с анализом информации, полученной из внешних источников данных, и передачей их на уровень приложения. В следующих статьях вы познакомитесь с несколькими методиками построения сводных таблиц с использованием данных, хранящихся во внешних файлах данных.


Top