FractalGPT показали обсуждение картинок текстом и Агентов с искусственным интеллектом
Демо интересно сразу из-за трех свойств:
а) Это первое демо, которое мы дадим попробовать пользователям — вы сможете загрузить в него свои картинки, мемы или медицинские снимки и получить ответ.(Мы выберем нескольких участников нашего чата и дадим доступ к боту на ограниченное время, по очереди, т.к. сейчас ядро системы поддерживает работу только с одним пользователем)
б) Это первое демо, которое даже отдаленно нельзя повторить или собрать на ChatGPT, и это явно видно
в) Медицинское применение
Дисклеймер
Снимки, использованные в этом демо получены из открытых источников (с сайта http://medicaldecathlon.com/ ). Также нами получено разрешение на использование ПО для анализа медицинских снимков в роли медицинского агента, который был встроен в систему на время демонстрации продукта FractalGPT.
На рисунке 1 показана основная схема ответа: система дает детальный ответ по вероятности обнаружить на снимке рак поджелудочной. При этом важно, что информация (названия показателей и их значения) от агента на рисунке 2, поступившая в LLM для генерации ответа не исказилась — эффекта галлюцинации нет.
В случае, если пользователь задает неполный вопрос, в примере «Тут есть рак поджелудочной» — агент отвечает на этот конкретный вопрос. Пользователь далее может уточнить детали, и система поймет его, учитывая контекст разговора и предоставляя детали (вероятность и размер), рисунок 5.
В следующем примере ведется разговор о математических терминах, а затем пользователь отправляет FractalGPT картинку из интернета: изображение схемы клетки, на котором есть подписи к различным ее частям (жгутики, мембрана и тп.). Пользователь просит рассказать об изображении подробнее и получает ответ.
Будущие адаптации
В этом демо показана мультимодальность и многоагентность системы, но важно, что система легко и удобно расширяется:
1. Предусмотрено добавление других агентов, решающими другие типы задач
2. Мультимодальность может работать не только для текста и изображений, но и для звука, видео, документов, или даже для их комбинации
3. Система устойчива к росту числа агентов и типов взаимодействий между ними, с ростом числа агентов устойчивость системы возрастает и не происходит накопления ошибок благодаря логическому выводу в модуле Fractal.
О проекте.
Подробнее о проекте можно узнать в нашем Телеграм: https://t.me/fractal_gpt
Наш Гитхаб: https://github.com/FractalGPT/FractalAGI
О нас
Понимаш Захар
Основатель проекта «FractalGPT».
Специалист в области машинного обучения и глубоких нейронных сетей. Разработчик собственного ИИ фреймворка AIFramework, а также системы логического вывода с мотивацией. Один из разработчиков: первого в РФ ИИ психолога Сабина и библиотеки для интерпретации генеративных нейросетей Transformer.
Носко Виктор
Продвижение проекта «FractalGPT».
Генеральный директор, ООО «Аватар Машина». Специалист в области генеративных нейросетей трансформер, интерпретируемого ИИ. Визионер открытого и этичного ИИ. Докладчик конференций по искусственному интеллекту: Conversations.ai, OpenTalks.ai, AGIconf, DataStart, AiMen. Активный участник сообщества AGIRussia. Один из разработчиков: первого в РФ ИИ психолога Сабина, библиотеки для интерпретации генеративных нейросетей transformer
Потанин Марат
C# AI-разработчик проекта «FractalGPT».
Специалист в области машинного обучения.
Full Stack C# ASP.NET.
Контрибьютор AIFramework. Соавтор программы для анализа медицинских снимков. Интересы: логический вывод, нейронные сети, обработка изображений, векторные базы данных, компьютерное зрение.