Юридический видео-бот — перспективно ли?
Добрый день, многоуважаемое Spark-сообщество!
Хотел бы поделиться идеей, родившейся у меня в голове, и спросить вашего совета о перспективности воплощения этой идеи в жизнь. Почитывая тематические порталы на тему бизнеса и инноваций, я заметил огромный интерес к чат-ботам как со стороны крупнейших IT-компаний, так и со стороны пользовательского сообщества.
После анализа множества тематического материала я решил, что это только начало, ведь следующая ветвь эволюции есть видео-боты, еще один шажок на пути к тому, что мы видели в научно-фантастических фильмах — голографическим помощникам, обладающим искусственным интеллектом.
Каким я вижу подобный видео-бот? Видео-бот есть 3D-модель, обладающая определенной логикой и способной к зачаткам логичного, осмысленного общения по профильным темам (здесь же и проектирование программного движка, и функция распознавания человеческого голоса, и набор решений по озвучке фраз бота).
Оценив то, что в настоящий момент есть на рынке я пришел к мысли о том, что ни одного достойного решения по реализации видео-ботов еще нет в природе.
Конечно, Microsoft презентовала Microsoft Bot Platform, что есть вполне удобный инструмент для проектирования видео-ботов, в том числе, в будущем, как мне кажется, но все завязано на Skype, а это не самый удобный в силу определенных обстоятельств и факторов продукт. Если что, демонстрационное видео технологии Microsoft —
Поэтому хотелось бы попробовать реализовать первую настоящую практическую видео-бот платформу. Сферу действия решения можно пластично изменять, но я, как студент юридического факультета, который плотно втерся в тему Legal Tech и Robo Law, посматриваю в сторону юридических консультаций.
“Первая роботизированная система юридических видео-консультаций”, звучит, черт побери! Или только мне звучит? Хотя, конечно, на такой платформе можно организовать и центр изучения иностранных языков, и виртуального персонального психолога, и даже, быть может, личного видео-секретаря.
Ведь это, мне кажется, действительно следующий уровень коммуникации в Сети. Одна кнопка и, вот, ты уже общаешься с машиной, причем это есть достаточно осмысленное общение. Рядовой пользователь даже не всегда сможет отличить, где есть живой человек, а где 3D-модель.
Относительно общего концепта реализации проекта у меня мысли следующие:
Cовременный видео-бот по своей сути является конструктором (а-ля конструктор Lego) независимых IT-решений. Вопрос лишь в общей организации подобного синтеза решений.
Если условно разделить работу видео-бота на несколько частей, то у нас получится:
1. Программный движок (работает с базой данных, осуществляет алгоритмизацию всего комплекса). В построение простенького чат-бота происходит по такой же схеме, если не учитывать потенциальные связующие элементы, то бишь API разных сервисов.
Если робот-юрист в англоязычных странах в как однобокое, не претендующее на оказание комплексных, многосторонних консультаций, решение был реализован на текстовой платформе, тогда в чем проблема перенести идею в видео-плоскость и существенно расширить функционал?
2. 3D-модель, которую видит пользователь. Здесь я думаю, что какое-то реалистичное решение доступно даже рядовому разработчику. Рынок 3D-моделей и 3D-дизайна развивается динамично, а поэтому результаты впечатляют —
Допустим, при проектировании консультанта или учителя можно даже задействовать использование комплекса эмоций.Почему я заостряю внимание на том, что будет видеть пользователь? Целевая аудитория проекта, люди ищущие юридические консультации в Сети, — широкий, многообразный народ. Уверен, что какой-нибудь пользователь на первых этапах общения даже не сможет определить, что общается с машиной. Такое, вот, инновационное исполнение существенно повышает уровень доверия к платформе.
3. Распознавание речи пользователя. На рынке существует ряд решений (в том числе и бесплатных, и с приемлемыми лицензиями) доступных для использования в прикладной деятельности. Я был поражен тем, как ко времени пришлось то, что Google в марте этого года выпустила для разработчиков Cloud Speech API. Я доверяю решениям Google. "О'кей Гугл" демонстрирует вполне стабильную и качественную работу. К тому же есть достойный Яндекс SpeechKit. 2016 год на дворе, технологии, которые недавно только зарождались уже пришли к какому-то результату.
4. Вывод речи. Здесь, конечно, ориентироваться надо на конкретные синтезаторы речи. Я и боюсь, что это действительно слабое место, когда речь заходит о русской локализации. Тем не менее есть в целом неплохие решения по выводу речи, но от эффекта роботизированности просто так не избавиться, к сожалению. А выигрышное место любого видео-бота — это, прежде всего, либо наглядная демонстрация какого-то визуального явления (привет конфигураторам автомобилей на сайтах автопроизводителей и демонстраторам одежды, как было в рекламе Skype Bot Platform, в Zara и H&M оценят), либо игра на факторе психологизма (ведь качественное исполнение не будет отличимо от реального человека). Но в при проектировании видео-бота в контексте интеграции его в конкретную, нишевую деятельность можно даже задуматься о настоящей, человеческой озвучке, если спецификация видео-бота будет в пределах какой-то узкой категории.
Определенный простор для монетизации, естественно, есть, но речь идет о создании бесплатного и массового сервиса.
Что думаете? Заинтересовала ли кого-то такая идея? Может быть даже у кого-то появилось желание принять участие в разработке?