Одна из последних экспериментальных моделей Google, Gemini-Exp-1206, демонстрирует потенциал для облегчения одной из самых сложных задач любого аналитика: синхронизации данных и визуализаций для создания убедительного повествования без необходимости работать всю ночь. Инвестиционные аналитики, младшие банкиры и члены консалтинговых команд, стремящиеся к партнерским позициям, знают, что долгие часы работы, выходные и редкие ночные смены могут дать им преимущество в продвижении по службе. То, что отнимает так много их времени, — это выполнение сложного анализа данных и создание визуализаций, которые подкрепляют убедительную историю. Сложность добавляет тот факт, что каждая банковская, финтех и консалтинговая фирма, такая как JP Morgan, McKinsey и PwC, имеет уникальные форматы и конвенции для анализа данных и визуализации.
VentureBeat взяла интервью у членов внутренних проектных команд, чьи работодатели наняли эти фирмы и назначили их на проект. Сотрудники, работающие в консалтинговых командах, сказали, что создание визуализаций, которые сокращают и консолидируют огромное количество данных, представляет собой постоянную проблему. Один из них сказал, что для консультантских команд обычным делом было работать по ночам и делать минимум три-четыре итерации визуализаций презентации, прежде чем остановиться на одной и подготовить ее для обновлений на уровне совета директоров.
Убедительный случай использования для тестирования последней модели Google. Процесс, на который полагаются аналитики для создания презентаций, поддерживающих историю с надежными визуализациями и графикой, включает множество ручных шагов и повторений, что делает его убедительным случаем для тестирования последней модели Google.
При запуске модели в начале декабря Патрик Кейн из Google написал: «Независимо от того, решаете ли вы сложные задачи по программированию, решаете математические задачи для школы или личных проектов, или предоставляете подробные пошаговые инструкции для создания индивидуального бизнес-плана, Gemini-Exp-1206 поможет вам справляться с сложными задачами с большей легкостью».
Google отметила улучшенную производительность модели в более сложных задачах, включая математическое мышление, программирование и выполнение ряда инструкций. На этой неделе было проведено тщательное тестирование модели Exp-1206 от Google. Создали и протестировали более 50 скриптов на Python в попытке автоматизировать и интегрировать анализ и интуитивно понятные визуализации, которые могли бы упростить сложные данные, подвергаемые анализу. Учитывая, насколько гипермасштаберы доминируют в новостных циклах сегодня, нашей конкретной целью было создание анализа данного технологического рынка, а также создание поддерживающих таблиц и сложной графики.
Через более чем 50 различных итераций проверенных скриптов на Python, выводы включали: чем сложнее запрос на код на Python, тем больше модель думает и пытается предугадать желаемый результат. Exp-1206 пытается предугадать, что требуется из данного сложного запроса, и будет варьировать то, что она производит, даже при малейшем изменении нюансов в запросе. Наблюдалось, как модель чередовала форматы типов таблиц, размещенных непосредственно над паучьей диаграммой анализа рынка гипермасштаберов, созданного для теста. Принуждение модели к сложному анализу данных и визуализации и созданию файла Excel выдает многостраничную таблицу. Несмотря на то, что не было запрошено создание многостраничной таблицы Excel, Exp-1206 создала ее. Основной табличный анализ был на одной вкладке, визуализации на другой и вспомогательная таблица на третьей. Поручение модели провести итерации данных и рекомендовать 10 визуализаций, которые она считает наиболее подходящими к данным, дает полезные, проницательные результаты. Стремясь сократить затраты времени на создание трех или четырех итераций слайдов перед проверкой на уровне совета директоров, мы заставили модель производить несколько концепций изображений. Их можно было бы легко доработать и интегрировать в презентацию, экономя множество часов ручной работы по созданию диаграмм на слайдах.
Цель состояла в том, чтобы увидеть, насколько далеко можно продвинуть модель с точки зрения сложности и многослойных задач. Ее производительность при создании, запуске, редактировании и тонкой настройке 50 различных скриптов на Python показала, как быстро модель пытается уловить нюансы в коде и немедленно реагировать. Модель адаптируется и изменяется на основе истории запросов. Результат запуска кода на Python, созданного с Exp-1206 в Google Colab, показал, что детализированная нюансированность распространяется на затенение и прозрачность слоев в восьмиугольной паучьей диаграмме, предназначенной для отображения того, как шесть конкурентов гипермасштаберов сравниваются. Восемь атрибутов, которые попросили Exp-1206 определить для всех гипермасштаберов и закрепить на паучьей диаграмме, оставались последовательными, в то время как графические представления варьировались.
Для теста выбрали следующих гипермасштаберов для сравнения: Alibaba Cloud, Amazon Web Services (AWS), Digital Realty, Equinix, Google Cloud Platform (GCP), Huawei, IBM Cloud, NTT Global Data Centers, Oracle Cloud и Tencent Cloud. Далее написали 11-шаговый запрос из более чем 450 слов. Цель состояла в том, чтобы увидеть, насколько хорошо Exp-1206 может справляться с последовательной логикой и не терять свое место в сложном многоэтапном процессе. Затем отправили запрос в Google AI Studio, выбрав экспериментальную модель Gemini 1206, как показано на рисунке ниже.
Следом скопировали код в Google Colab и сохранили его в блокноте Jupyter (Hyperscaler Comparison – Gemini Experimental 1206.ipynb), затем запустили скрипт на Python. Скрипт сработал безупречно и создал три файла (обозначенных красными стрелками в верхнем левом углу).
Сравнительный анализ гипермасштаберов и графика — менее чем за минутуПервая серия инструкций в запросе попросила Exp-1206 создать скрипт на Python, который сравнивает 12 различных гипермасштаберов по их названию продукта, уникальным особенностям и различий, и местоположениям дата-центров. Ниже показано, как выглядел запрашиваемый файл Excel в скрипте. На создание таблицы, чтобы сжать ее в столбцы, ушло менее минуты.
Следующая серия команд запросила таблицу из шести лучших гипермасштаберов, сравниваемых в верхней части страницы, и паучью диаграмму ниже. Exp-1206 выбрала самостоятельно представить данные в формате HTML, создав страницу ниже.
Последовательность конечных команд запроса сосредоточилась на создании паучьей диаграммы для сравнения шести лучших гипермасштаберов. Мы поручили Exp-1206 выбрать восемь критериев для сравнения и завершить построение графика. Эта серия команд была переведена на Python, и модель создала файл и предоставила его в сессии Google Colab.
Модель, созданная для экономии времени аналитиков узнала, что в своей повседневной работе аналитики продолжают создавать, делиться и совершенствовать библиотеки запросов для конкретных AI-моделей с целью оптимизации отчетности, анализа и визуализации в своих командах. Команды, назначенные на крупномасштабные консалтинговые проекты, должны рассмотреть, как модели, такие как Gemini-Exp-1206, могут значительно повысить производительность и снизить необходимость в рабочих неделях продолжительностью более 60 часов и редких ночных сменах. Серия автоматизированных запросов может выполнять исследовательскую работу по изучению отношений в данных, позволяя аналитикам создавать визуализации с гораздо большей уверенностью без необходимости тратить чрезмерное количество времени на это.
Тестирование запроса для Google Gemini Experimental 1206:
Напишите скрипт на Python для анализа следующих гипермасштаберов, которые объявили о глобальной инфраструктуре и присутствии дата-центров для своих платформ, и создайте таблицу, сравнивающую их, которая захватывает значительные различия в каждом подходе к глобальной инфраструктуре и присутствию дата-центров.
Сделайте первый столбец таблицы названием компании, второй столбец — названиями каждого из гиперскейлеров компании, которые имеют глобальную инфраструктуру и присутствие дата-центров, третий столбец — чем их гиперскейлеры уникальны и глубокое изучение наиболее отличительных особенностей, и четвертый столбец — местоположения дата-центров для каждого гиперскейлера на уровне города, штата и страны. Включите всех 12 гиперскейлеров в файл Excel. Не используйте веб-скрейпинг. Создайте файл Excel с результатом и отформатируйте текст в файле Excel так, чтобы он был свободен от любых скобок ({}), кавычек (‘), двойных звездочек (**) и любого HTML-кода для улучшения читаемости. Назовите файл Excel Gemini_Experimental_1206_test.xlsx.
Затем создайте таблицу, которая будет шириной в три столбца и глубиной в семь строк. Первый столбец назовите "гиперскейлер", второй — "уникальные особенности и различия", и третий — "инфраструктура и местоположения дата-центров". Выделите жирным шрифтом заголовки столбцов и выровняйте их по центру. Также выделите жирным шрифтом названия гиперскейлеров. Дважды проверьте, чтобы текст в каждой ячейке этой таблицы перенесся и не пересекался с соседней ячейкой. Отрегулируйте высоту каждой строки, чтобы весь текст поместился в предназначенной ячейке. Эта таблица сравнивает Amazon Web Services (AWS), Google Cloud Platform (GCP), IBM Cloud и Oracle Cloud. Выровняйте таблицу по центру в верхней части страницы вывода. Затем возьмите Amazon Web Services (AWS), Google Cloud Platform (GCP), IBM Cloud и Oracle Cloud и определите восемь наиболее отличительных аспектов группы.
Используйте эти восемь отличительных аспектов для создания радиальной диаграммы, которая сравнивает эти шесть гиперскейлеров. Создайте одну большую радиальную диаграмму, которая четко показывает различия в этих шести гиперскейлерах, используя разные цвета для улучшения читаемости и возможности увидеть контуры или отпечатки разных гиперскейлеров. Обязательно озаглавьте анализ: Что больше всего отличает гиперскейлеров, декабрь 2024 года. Убедитесь, что легенда полностью видна и не перекрывает график.Добавьте радиальную диаграмму в нижнюю часть страницы. Выровняйте радиальную диаграмму под таблицей на странице вывода.Это гиперскейлеры, которые нужно включить в скрипт Python: Alibaba Cloud, Amazon Web Services (AWS), Digital Realty, Equinix, Google Cloud Platform (GCP), Huawei, IBM Cloud, NTT Global Data Centers, Oracle Cloud, Tencent Cloud.
Источник новости: habr.com