Масштабировать LLM приложения в продакшне часто невозможно

square imagesquare flag
AskarAituov
Последнее обновление 21 июн. 24

Около года назад все, что я слышал от реального сектора (enterprise МСБ), это то, как сильно они хотят использовать LLM-ки в продакшне.

Сейчас я получаю массу новостей о эти МСБшники ставят пилоты на паузу.

Оказывается, масштабировать приложения на базе LLM за пределы красивой демо-версии сложно, а во многих случаях даже невозможно.

Системы RAG также не являются Святым Граалем. Это лучше, чем ничего, но после определенного момента они уже не помогают. Встраивание структурированного контента и использование косинусного сходства во многих ситуациях ненадежно и непрактично.

Маятник качнулся назад.

Это хорошая вещь. Пришло время оставить шумиху позади. Только тогда мы сможем сосредоточиться на улучшении того, что у нас есть. Автор Сантьяго директор ML.school. Вольный перевод от @devs_kz

Источник: https://t.me/devs_kz

Канал об IT карьере в Казахстане и странах Центральной Азии от экспертов Google и др. ИТ компаний. Менторские программы по управлению проектами и продуктами, и Google sheets https://mentors.devs.kz/

Комментарии