Лингвистика Переводим сами

Speak — приложение для языкового обучения

В нашей серии интервью «Executive Function» с мнением людей, которые меняют мир с помощью ИИ. 

Speak⁠ — это приложение для изучения языков, которое помогает пользователям достичь свободного владения языком с помощью самого продвинутого ИИ-репетитора в мире. Мы поговорили с Коннором Цвиком, CEO Speak, о том, как ИИ преобразовывает изучение языков, о прорывах, делающих ИИ-репетиторов более естественными, и о сложностях масштабирования стартапа в условиях стремительного развития технологий. 

Каким был ваш первый значимый опыт работы с ИИ, и как он повлиял на создание Speak? 

Если оглянуться на последние 10+ лет, в памяти всплывает несколько моментов, которые действительно повлияли на моё восприятие ИИ. 

В 2012 году вышла статья об AlexNet, и даже простая классификация изображений с помощью глубоких нейросетей казалась невероятно крутой. Потом был AlphaGo — ещё один важный этап. Но лично для меня ключевым стал 2015 год. Мы с сооснователем проводили собственные исследования в области ИИ: изучали статьи, тестировали различные методы. В качестве стороннего проекта мы собирали данные с YouTube.  Мы загрузили их в модель, не зная, чего ожидать. Через несколько часов обучения протестировали её и обнаружили, что наша модель лучше всех существующих в распознавании акцентов.

Крайне важно понимать разницу между точностью в 90%, 98%, 99% и 99,9% и какое при этом влияние оказывается на пользовательский опыт. Разница между 90% и 99,9% колоссальна, поэтому уметь предугадывать, когда начнётся рост, необходимо для стратегического планирования.

Какой последний технический прорыв в области ИИ изменил ваш взгляд на возможности Speak?

Это просто — API в реальном времени от OpenAI и мультимодальность аудио. В нашем случае, когда мы создаём ИИ-репетитора, обладающего невероятным потенциалом к обучению разговорной речи, крайне важно понимать, что именно хочет сказать ученик, а не просто распознавать его слова.

Ключевой целью ИИ-обучения является умение сразу распознать, с какой интонацией и намерением говорит ученик, как он произносит слова, и тут же отвечать естественно и в похожей манере.

Есть ли другие направления ИИ, которые на первый взгляд не имеют никакого отношения к Speak, но кажутся вам интересными?

Многие говорят, что следующий этап развития ИИ – это способность мыслить, и здесь я полностью согласен. Лучшие педагоги отличаются способностью разрабатывать эффективные учебные программы, глубоко анализировать динамику успеваемости и вносить своевременные коррективы. Если ИИ обретёт такие же способности, это станет настоящим прорывом в сфере языкового обучения. Может, не самое очевидное направление развития данной сферы, но его влияние будет значительным — ИИ-репетиторы смогут сравниться по эффективности с лучшими преподавателями.

Как, по-вашему, изменится роль преподавателей языков в эпоху ИИ?

Миллиарды людей учат английский и другие языки, но высококвалифицированных преподавателей не хватает. Многие вынуждены прибегать к обучающим видеоматериалам или книгам, которые, увы, не дают эффекта живого общения. В конце концов, язык учат, чтобы взаимодействовать  с людьми, а не с роботом. Однако когда машина станет умнее нас, практика с живыми носителями останется важным аспектом обучения.

«Речь идёт не о замене преподавателей. А о том, чтобы сделать обучение лучше и доступнее для людей по всему миру».

По мере развития Speak, вы помогаете команде лучше разбираться в ИИ?

Главное — найти правильных людей. В наших работниках мы ценим любопытство. Мы ищем любителей экспериментировать и искать способы, как с помощью ИИ усилить свой вклад в работу.

У ChatGPT есть одна особенность — эффект «чистого холста»: пока человек случайно не придумает применение машине, не получится понять, как ее использовать. ИИ — универсальный инструмент, и мы побуждаем команду постоянно задаваться вопросом: «Могу ли я тут использовать ИИ?» и проверять гипотезу.

Какие тренды в области ИИ сильнее всего повлияют на изучение языков в будущем?

Всё можно сделать ещё лучше, но сейчас задача — выжать максимум из того, что уже есть, и создать самый востребованный продукт на базе существующих технологий. Есть много технических сложностей в применении ИИ, и мы называем это «ML-опорой»:  такая технология, на которой строится весь пользовательский опыт взаимодействия с продуктом.

Мы работаем в этом направлении достаточно давно и обладаем определённым преимуществом, однако многое еще предстоит сделать. Даже если развитие ИИ остановится сегодня, нам хватит задач на годы вперёд. «Данные модели демонстрируют особенно высокую эффективность в работе с языком и в сфере общения. Возможно, в других отраслях по-прежнему требуются серьёзные технологические достижения для того, чтобы ИИ реально что-то поменял, однако я полагаю, что в нашей сфере уже есть всё необходимое».


Автор статьи: OpenAI

Источник: https://openai.com/index/speak-connor-zwick/

Дата публикации: 05.07.2025

Перевод: Охотская М.А., Погосов Л.Л.

Похожие статьи