Опрос: Jailbreak Scaling Laws: short prompts — power-law ASR, long — exponential с samples. Главный инсайт для open-source LLM 3B-70B?
Варианты:
— Short prompts: power-law scaling
— Long prompts: exponential рост
— Стабильно across methods/datasets
— Spin-glass модель proxy language
Open Source LLM — Llama / Qwen / DeepSeek
@open_source_llm_aff
Опрос: Jailbreak Scaling Laws: short prompts — power-law ASR, long — exponential с samples. Главный инсайт для
Источники:
Этот пост опубликован в Telegram-канале Open Source LLM — Llama / Qwen / DeepSeek. Подписаться можно по ссылке: @open_source_llm_aff.