basebel
basebel
27 октября 2024 в 13:00
#abbyy $GOOGL $GOOG #интересное Горький урок ABBYY: как лингвисты проиграли последнюю битву за NLP  Недавно СМИ облетела новость об увольнении всех российских программистов из компании ABBYY (тоже в прошлом российской, а теперь уже совсем нет). Теперь, когда страсти вокруг обсуждения дискриминации сотрудников по паспорту улеглись, хочется поговорить о более глубокой истории. Закат ABBYY — это фиксация проигрыша последней битвы лингвистов за автоматическую обработку языка. Мир Data Science победил. Главный редактор «Системного Блока» Даниил Скоринкин, работавший ABBYY в 2013–2017, подводит итоги и пытается сформулировать уроки из этой истории. https://sysblok.ru/blog/gorkij-urok-abbyy-kak-lingvisty-proigrali-poslednjuju-bitvu-za-nlp/ Что за ABBYY и при чем тут лингвисты и NLP? История ABBYY началась в 1989 году, когда студент МФТИ Давид Ян решил сделать электронный словарь для подготовки к экзамену. Так появились Lingvo, а затем — система распознавания символов FineReader. Продукты ABBYY развивались, и компания стала глобальным лидером оптического распознавания в 1990-е и 2000-е. Затем ABBYY двинулась покорять машинный перевод.  https://sysblok.ru/courses/kak-raspoznat-teksty-i-sdelat-korpus-dlja-issledovanija-poshagovaja-instrukcija/ На вооружение они взяли идеи известных лингвистов — в первую очередь Модели «Смысл ⇔ Текст» (прочитать о ней можно в нашем интервью с И. А. Мельчуком). Амбиция была в том, чтобы разобрать человеческие языки как формальные структуры на базе семантической иерархии. Но естественный язык устроен противоречиво и постоянно изменяется, подход оказался негибким и немасштабируемым https://sysblok.ru/interviews/menja-interesuet-znat-a-ne-prosto-umet-igor-melchuk-o-netradicionnoj-lingvistike-mashinnom-perevode-i-zhizni-v-kanade/ Что пошло не так? В 2006-м появилась первая версия Google Translate. Она была несовершенной, но главное, что в ней был другой — статистический — подход. И масштабируемость. Для её улучшения не нужны были сотни лингвистов, только еще больше примеров перевода. В 2010-х стало ясно, что никаких шансов тягаться с Google Translate у ABBYY не было. С перевода ABBYY переключилась на задачи информационного поиска и извлечения информации из текста, но и там столкнулась с теми же проблемами: описания языка на базе лингвистической теории оказались немасштабируемыми, а решения уступали подходам на основе чистого машинного обучения.  C новой проблемой компания столкнулась весной 2022 – им пришлось выехать из России, чтобы сохранить зарубежных клиентов. Следующим ударом стали большие языковые модели, который научились выполнять те же задачи, что и классические системы распознавания от ABBYY. Сейчас от компании осталась только вывеска, действующие продукты и небольшое количество менеджеров и специалистов по продажам. Какие уроки мы извлекаем? За 70 лет исследований ИИ стало ясно, что самые общие методы, опирающиеся на масштабирование вычислений, намного эффективнее всех остальных. А желание ABBYY сделать универсальную NLP-систему с опорой на лингвистическую теорию оказалось утопией.  И всё-таки ABBYY успела сделать много важного: открывала кафедры на Физтехе и в РГГУ, оцифровывала наследия Льва Толстого и архива Большого театра. А еще благодаря ей появился «Системный Блокъ», ведь сооснователи издания познакомились именно там. И именно там вы сможете прочитать полную версию поста с мемами, фотографиями и более детальным описанием цифровой «Вавилонской башни», которую пыталась строить ABBYY. https://sysblok.ru/blog/gorkij-urok-abbyy-kak-lingvisty-proigrali-poslednjuju-bitvu-za-nlp/
165,27 $
+5,35%
166,99 $
+5,17%
6
Нравится
Не является индивидуальной инвестиционной рекомендацией
Читайте также
18 ноября 2024
Норникель: наше мнение об акциях
18 ноября 2024
МТС: высокая дивидендная доходность, а вместе с ней и риски
Анализ компаний
Подробные обзоры финансового потенциала компаний
Vlad_pro_Dengi
+40,5%
10,2K подписчиков
FinDay
+29,8%
29,2K подписчиков
Invest_or_lost
+4,5%
24,5K подписчиков
Норникель: наше мнение об акциях
Обзор
|
18 ноября 2024 в 19:31
Норникель: наше мнение об акциях
Читать полностью
basebel
1,6K подписчиков 235 подписок
Портфель
до 10 000 000 
Доходность
+7,13%
Еще статьи от автора
18 ноября 2024
#незеленая_повестка SHEL Европейский нефтегаз выходит из зеленых проектов Почти пять лет назад BP предприняла амбициозную попытку трансформироваться из нефтяной компании в бизнес, ориентированный на низкоуглеродную энергетику. Сейчас британская компания пытается вернуться к своим истокам как крупный игрок на нефтегазовом рынке. Конкуренты Shell и контролируемая государством норвежская Equinor также сворачивают планы энергетического перехода, начатые в начале этого десятилетия. BP замедлила низкоуглеродные операции, остановив 18 потенциальных водородных проектов на ранней стадии и объявив о планах продажи ветровых и солнечных проектов. Недавно компания сократила свою водородную команду в Лондоне более чем наполовину до 40 сотрудников, пишет Reuters. Shell сократила низкоуглеродные операции, включая проекты по строительству плавучих ветровых электростанций и водородных электростанций, ушла с европейского и китайского рынков электроэнергии, продала НПЗ и ослабила целевой показатель по сокращению выбросов углерода к 2030 году. Shell ищет покупателей для Select Carbon, австралийской компании специализирующейся на разработке агропроектов, используемых для компенсации выбросов углерода. Equinor, несмотря на то, что еще продолжает инвестировать в ВИЭ-проекты, начала пересмотр своего низкоуглеродного бизнеса , получивший внутреннее название REN Adjust, в рамках которого было отменено уже несколько идей на ранней стадии, чтобы сосредоточиться на более продвинутых проектах по производству морской ветроэнергии.
18 ноября 2024
VKCO Сложно переоценить роль открытого исходного кода в буме ИИ-решений на западе. Приятно наблюдать, как лучшие мировые практики конкурентности в сфере технологий живут и на российском рынке. Один из лидеров российского IT-сегмента по-видимому планирует делиться своими наработками с другими разработчиками. https://www.forbes.ru/tekhnologii/525235-vk-otkroetsa-miru-kompania-podelitsa-svoimi-razrabotkami-v-formate-open-source, По данным портала Whois.ru, VK зарегистрировала домены opensourcevk.ru и vkopensource.ru. Источники на рынке говорят, что компания планирует намного активнее выкладывать в публичный доступ свои разработки в следующих направлениях: ▪️ IT-системы и продукты (помним, что компания уже выложила в opensource решение для ускорения IT-систем и обработки данных Tarantool — её используют, например, Альфа-банк, Газпромбанк, ВТБ) ▪️ инструменты и библиотеки для разработчиков ▪️ ИИ-модели Сильный шаг от VK, направленный на развитие российского IT-комьюнити.
18 ноября 2024
CHMF Совет директоров ПАО "Северсталь" утвердил программу облигаций для сотрудников компании объемом до 10 млрд рублей, а также 3-летний выпуск бондов, который планируется разместить в рамках программы, на 3 млрд рублей. Максимальный срок обращения бумаг в рамках бессрочной программы составит 10 лет. https://www.interfax.ru/business/993255