Блог
Последние новости, туториалы и идеи об ИИ
Последние новости, туториалы и идеи об ИИ

Новая открытая модель Zephyr 7B от HuggingFace доказывает, что дистилляция с DPO может конкурировать с RLHF, обеспечивая высокое качество при меньших вычислительных затратах.