Дьявол кроется в деталях, или триумф местных языков

square image
ml4room
Последнее обновление 12 мар. 25
Дьявол кроется в деталях, или триумф местных языков
Дьявол кроется в деталях, или триумф местных языков

Богатые языковые данные и уникальная система иероглифов помогают ИИ выйти на новый уровень, считают эксперты.

Китайская компания DeepSeek, разрабатывающая искусственный интеллект, стремительно набирает популярность, меняя технологический и инвестиционный ландшафт. В центре обсуждений — ключевые факторы, обеспечившие этой доступной языковой модели неожиданное преимущество перед глобальными конкурентами, такими как ChatGPT.

DeepSeek получил признание за высокую производительность, открытый исходный код и доступность. Однако в онлайн-сообществах растёт убеждённость, что одна из главных причин его успеха — использование китайских символов в процессе предобучения модели.

Сторонники этой теории утверждают, что высокая информационная плотность китайских текстов улучшила логические способности DeepSeek, повысив его эффективность в обработке языка. Китайские иероглифы, являясь идеограммами, передают смысл даже при ошибках написания, что упрощает восприятие текста.

«Китайские иероглифы обеспечивают максимальную передачу информации при минимальных затратах. Как эффективный метод кодирования данных, китайский язык значительно повысил эффективность обработки информации и снизил вычислительные затраты искусственного интеллекта», — отметил аналитик телекоммуникационной отрасли Сян Лиган в своем посте в соцсетях в понедельник.

ИИ вступает в эру китайского языка

Некоторые эксперты также считают, что китайская письменность тесно связана с другими форматами информации, такими как изображения и аудио. Традиционная китайская поэзия, например, часто сочетается с живописью или музыкой, что, по их мнению, могло обеспечить DeepSeek богатым мультимодальным учебным материалом.

В отчете технологического медиа-портала DeepTech доцент Йельского университета Ян Чжуоран подчеркнул, что качество данных играет ключевую роль в обучении больших языковых моделей. Оно влияет не только на способность ИИ приобретать и выражать знания, но и на его стиль работы.

Хотя точные источники обучающих данных DeepSeek не раскрываются, некоторые предполагают, что они включают классическую китайскую литературу, интернет-сленг, академические исследования, правительственные документы и даже региональные диалекты.

Таким образом, уникальные особенности китайского языка и богатство доступных данных могут стать одним из главных факторов, позволяющих DeepSeek успешно конкурировать с западными моделями искусственного интеллекта.

Подписывайтесь на нашего телеграм бота по ссылке или сканируйте QR код ниже 💜

ReLife Global | Дьявол кроется в деталях, или триумф местных языковReLife Global | Дьявол кроется в деталях, или триумф местных языков

Комментарии