LLM101n: Андрей Карпаты анонсировал курс по созданию LLM с нуля
LLM — большие языковые модели, использующие алгоритмы машинного обучения для генерации и прогнозирования человеческих языков. Они обучаются на массивах данных. Примечательно, что происходит процесс без особого наблюдения. Модель LLM должна уметь определить следующее слово на основе текста, данного на входе.
Один из основателей OpenAI Андрей Карпаты недавно представил анонс уникального курса по созданию с нуля LLM. По словам Андрея, на курсе ученики смогут тесно взаимодействовать с ИИ, совершенствовать и иллюстрировать небольшие истории, построить полноценно функционирующее приложение. К концу курса каждый будет глубоко знаком и с LLM, и с ИИ.
Также анонсирован план учебы и обозначены основные темы, которые будут затронуты и изучены в рамках курса. Ученикам предстоит столкнуться с изучением моделирования языка, понятием токенизации, набора данных и множеством других терминов и функций сферы IT.
Мне нравится обучать глубокие нейронные сети на больших наборах данных