Что такое Excel hell и как с ним бороться
Excel hell — это состояние, когда много важной для компании информации содержится в excel-файлах сотрудников, происходит постоянный обмен этими файлами по почте, и сложно сказать у кого самая последняя и правильная версия. Для получения общей картины нужно сводить данные из этих файлов в один, что на практике часто сводится к copy-paste, занимает много времени и приводит к ошибкам. В итоге люди мало того что с трудом получают информацию, но еще и рискуют принять неправильные решения на основе устаревших или вовсе неправильных данных. Звучит ужасно, но похоже что это не редкость, и нельзя сказать что ситуация улучшается. Как мы к этому пришли?
Немного истории
В начале все было не так уж плохо — в 1973 году электронные таблицы VisiCalc стали тем приложением, ради которого покупали Apple II, и превратили персональный компьютер из забавы немногих любителей в востребованный бизнесом инструмент. Конечно, они не были первой табличной программой, или первым инструментом финансового моделирования — магия VisiCalc была в том, что они они были первыми интерактивными таблицами, позволяя сразу видеть результат, задавать формулы прямо в ячейках, давая возможность за несколько минут делать то, что до этого требовало программирования или нудных расчетов на бумаге. Дэн Бриклин и Боб Фрэнкстон придумали то, что и сейчас определяет этот класс программ: схему нумерации ячеек, ссылки на ячейки в формулах, задание ссылок через перемещение по ячейкам и т.д. Кстати, в 1995 году Дэн Биркин выложил версию VisiCalc для DOS, которая вполне возможно запустится даже в современном Windows.
VisiCalc на Apple II
Пока авторы VisiCalc судились со своими издателями, в 1983 году вышел Lotus 1-2-3 и почти сразу "убил" своего конкурента просто потому, что был лучше: поддерживал дробные числа, изменение размера ячеек, работал на IBM PC и позволял использовать больше памяти и большее разрешение экрана, скоро обзавелся макросами и графиками. Электронные таблицы стали излюбленным инструментом финансового анализа, моделирования и просто работы с более-менее структурированными данными и числами. Современные аналоги конечно обросли огромным числом фич и фишек, но основа почти не изменилась. Но всегда ли они используются по назначению?
Excel hell
Маша и Петя работают в крупном интернет-магазине. Задача Пети — планирование закупок и определение цен на сотовые телефоны и аксессуары к ним. Основная выручка идет с аксессуаров: Пете нужно следить за тем, чтобы цены на те телефоны, по которым компания продает больше всего аксессуаров, были не выше чем у конкурентов, и на всех точках хватало товаров. Утром он получает очередную выгрузку из 1С, огромный excel-файл с данными по продажам за последний месяц, остатками на точках и прочей информацией, по которой он может проанализировать ситуацию. Петя вводит в Excel сколько единиц товара нужно закупить, и корректирует цену в интернет-магазине. Вечером Маша сводит все в один файл и проверяет работу сотрудников, каждый из которых отвечает за свои категории. Она вносит необходимые исправления и отправляет файл для загрузки на сайт и в отдел закупок. В файлах уже много формул и макросов, часто добавляются новые или вносят исправления, строят новые отчеты для анализа данных. Excel-файлы снуют туда-сюда по почте, работа кипит, магазин растет.Тут что-то не так:- сложно понять, каково текущее состояние, где последняя актуальная версия?
- кто и когда поменял это число или формулу?
- когда отвиснет Excel?
- где тот классный отчет, который придумала Таня три месяца назад? И как построить его за этот месяц данных?
- когда же я пойду домой?
Но почему вообще люди начинают использовать Excel для такой задачи? На нем легко получить первые результаты, быстро построить прототип, очень многие неплохо его знают. Удобно что в одной системе можно и вводить, и анализировать данные, и сразу видеть результат. Часто большего и не надо. Но если данных становится много, информационная модель усложняется, с данными работает несколько человек, то появляется необходимость в переходе на другой инструмент, добавляя структуру и отслеживаемость, но при этом желательно не теряя в гибкости и возможностях.Очевидно, что проблема не нова: например, создатель известного стартап-акселератора Y-Combinator Пол Грэм составил в 2008 году список идей, реализацию которых он хотел бы увидеть: Startup Ideas We'd Like to Fund. За номером 22 в этом списке идет идея гибрида Excel и базы данных:
People often use Excel as a lightweight database. I suspect there's an opportunity to create the program such users wish existed,… Don't make it feel like a database. That frightens people. The question to ask is: how much can I let people do without defining structure?На всякий случай, Google Spreadsheets в то время уже два года как работали. С тех пор появилось несколько продуктов, которые были скорее похожи на СУБД с веб-интерфейсом: DabbleDB, Ragic, и некоторые другие, но ни один из них не смог занять эту нишу.
Подойти к этой проблеме со стороны электронных таблиц пробовала компания Lotus со своим Lotus Improv, выпущенном в 1991 году. Основное отличие состояло в том, что в Improv исходные данные, промежуточные значения и формулы были отдельными понятиями, а не перемешаны на одном листе, как во всех привычных электронных таблицах. Вместо того чтобы обращаться к данным по адресам ячеек, в формулах Lotus Improv вы обращались к ним по имени, а за счет четкого разделения данных и представления сводные таблицы были естественным способом анализа. В Excel структура данных и логика работы задается неявным образом: через расположение ячеек и протягиванием формул, и фактически содержится в голове того, кто создавал таблицу, а в Improv это базовые понятия, которые в явном виде содержатся в результате вашей работы. Но несмотря на восторженные отзывы и отличный старт продаж на платформе NeXTSTEP, продажи под Windows оказались очень слабыми, и разработка была остановлена уже в 1994 году. Основной причиной провала считается конкуренция со стороны другого продукта Lotus, 1-2-3, хотя небезызвестный Джоэл Спольски считает, что основное достоинство Improv, структура, являлось на самом деле главным недостатком, и что пользователям сложно впихнуть реальные данные в определенную структуру.После остановки продаж Improv появилось несколько клонов, часть из которых даже дожила до сегодняшнего дня, а многие идеи были реализованы затем в Excel.
Lotus Improv на NeXTSTEP: сводные таблицы
Excel тоже не стоял на месте, обрастая возможностями по отслеживанию изменений, интеграции с базами данных и т.п. Но можно ли сказать, что сейчас задача решена? Это-то мы и хотим узнать.
Причем тут мы?
Наш взгляд на решение этой проблемы — гибрид системы анализа данных и базы данных с возможностью гибкого задания структуры данных, которая позволяет легко задавать вычисления в стиле Improv. У нас есть такое решение — qubequ.com и мы хотим лучше понять сферу его применения. Потому что взгляд — это, конечно, хорошо, но цена ему ноль без проверки на практике и понимания конкретных проблем, которые стоят перед компаниями и людьми, которые в них работают. Очевидно, что проблема не только техническая, и что есть много ситуаций когда уже есть хорошее техническое решение, но люди не знают о его существовании или о том, как его использовать.Если в вашей организации активно используется Excel, то нам интересно узнать:
- какой бизнес-процесс работы с Excel? (несколько человек заполняют однотипные таблицы и требуется их объединение / один человек регулярно готовит отчеты и рассылает их / другое? )
- какова цена ошибки в процессе/данных, насколько для вас важна оперативность, много вы теряете из-за Excel hell?
- удовлетворяет ли вас Excel? Если нет, то какие другие решения вы пробовали/обдумывали и почему они не подошли?