В нашей серии интервью «Executive Function» с мнением людей, которые меняют мир с помощью ИИ.
Speak — это приложение для изучения языков, которое помогает пользователям достичь свободного владения языком с помощью самого продвинутого ИИ-репетитора в мире. Мы поговорили с Коннором Цвиком, CEO Speak, о том, как ИИ преобразовывает изучение языков, о прорывах, делающих ИИ-репетиторов более естественными, и о сложностях масштабирования стартапа в условиях стремительного развития технологий.
Каким был ваш первый значимый опыт работы с ИИ, и как он повлиял на создание Speak?
Если оглянуться на последние 10+ лет, в памяти всплывает несколько моментов, которые действительно повлияли на моё восприятие ИИ.
В 2012 году вышла статья об AlexNet, и даже простая классификация изображений с помощью глубоких нейросетей казалась невероятно крутой. Потом был AlphaGo — ещё один важный этап. Но лично для меня ключевым стал 2015 год. Мы с сооснователем проводили собственные исследования в области ИИ: изучали статьи, тестировали различные методы. В качестве стороннего проекта мы собирали данные с YouTube. Мы загрузили их в модель, не зная, чего ожидать. Через несколько часов обучения протестировали её и обнаружили, что наша модель лучше всех существующих в распознавании акцентов.
Крайне важно понимать разницу между точностью в 90%, 98%, 99% и 99,9% и какое при этом влияние оказывается на пользовательский опыт. Разница между 90% и 99,9% колоссальна, поэтому уметь предугадывать, когда начнётся рост, необходимо для стратегического планирования.
Какой последний технический прорыв в области ИИ изменил ваш взгляд на возможности Speak?
Это просто — API в реальном времени от OpenAI и мультимодальность аудио. В нашем случае, когда мы создаём ИИ-репетитора, обладающего невероятным потенциалом к обучению разговорной речи, крайне важно понимать, что именно хочет сказать ученик, а не просто распознавать его слова.
Ключевой целью ИИ-обучения является умение сразу распознать, с какой интонацией и намерением говорит ученик, как он произносит слова, и тут же отвечать естественно и в похожей манере.
Есть ли другие направления ИИ, которые на первый взгляд не имеют никакого отношения к Speak, но кажутся вам интересными?
Многие говорят, что следующий этап развития ИИ – это способность мыслить, и здесь я полностью согласен. Лучшие педагоги отличаются способностью разрабатывать эффективные учебные программы, глубоко анализировать динамику успеваемости и вносить своевременные коррективы. Если ИИ обретёт такие же способности, это станет настоящим прорывом в сфере языкового обучения. Может, не самое очевидное направление развития данной сферы, но его влияние будет значительным — ИИ-репетиторы смогут сравниться по эффективности с лучшими преподавателями.
Как, по-вашему, изменится роль преподавателей языков в эпоху ИИ?
Миллиарды людей учат английский и другие языки, но высококвалифицированных преподавателей не хватает. Многие вынуждены прибегать к обучающим видеоматериалам или книгам, которые, увы, не дают эффекта живого общения. В конце концов, язык учат, чтобы взаимодействовать с людьми, а не с роботом. Однако когда машина станет умнее нас, практика с живыми носителями останется важным аспектом обучения.
«Речь идёт не о замене преподавателей. А о том, чтобы сделать обучение лучше и доступнее для людей по всему миру».
По мере развития Speak, вы помогаете команде лучше разбираться в ИИ?
Главное — найти правильных людей. В наших работниках мы ценим любопытство. Мы ищем любителей экспериментировать и искать способы, как с помощью ИИ усилить свой вклад в работу.
У ChatGPT есть одна особенность — эффект «чистого холста»: пока человек случайно не придумает применение машине, не получится понять, как ее использовать. ИИ — универсальный инструмент, и мы побуждаем команду постоянно задаваться вопросом: «Могу ли я тут использовать ИИ?» и проверять гипотезу.
Какие тренды в области ИИ сильнее всего повлияют на изучение языков в будущем?
Всё можно сделать ещё лучше, но сейчас задача — выжать максимум из того, что уже есть, и создать самый востребованный продукт на базе существующих технологий. Есть много технических сложностей в применении ИИ, и мы называем это «ML-опорой»: такая технология, на которой строится весь пользовательский опыт взаимодействия с продуктом.
Мы работаем в этом направлении достаточно давно и обладаем определённым преимуществом, однако многое еще предстоит сделать. Даже если развитие ИИ остановится сегодня, нам хватит задач на годы вперёд. «Данные модели демонстрируют особенно высокую эффективность в работе с языком и в сфере общения. Возможно, в других отраслях по-прежнему требуются серьёзные технологические достижения для того, чтобы ИИ реально что-то поменял, однако я полагаю, что в нашей сфере уже есть всё необходимое».
Автор статьи: OpenAI
Источник: https://openai.com/index/speak-connor-zwick/
Дата публикации: 05.07.2025
Перевод: Охотская М.А., Погосов Л.Л.