Open Source LLM — Llama / Qwen / DeepSeek

Опрос: Простой sentence-level multilingual CSD улучшает perf по en/ja/ko/zh за пределами bilingual. Протестиру

Опрос: Простой sentence-level multilingual CSD улучшает perf по en/ja/ko/zh за пределами bilingual. Протестируете в файнтюнах?

Варианты:
— Да, для Qwen/DeepSeek
— Нет, bilingual transfer хватит
— Сначала бенчмарки на Belebele
— Не мои языки
Источники:
Этот пост опубликован в Telegram-канале Open Source LLM — Llama / Qwen / DeepSeek. Подписаться можно по ссылке: @open_source_llm_aff.
start

Готовы запустить рекламу через сеть public.tg?

Новый оффер, продукт, GEO, кейс, событие или партнёрский запуск — соберём маршрут под задачу и отдадим медиаплан.

Telegram для медиаплана: @dumay. Быстрый тест: $20 за канал, $99 за пакет по сети.