576просмотров
21 марта 2025 г.
Score: 634
#Links@alisaolega за прошедшую неделю, чтобы посмотреть на выходных: — 📹 Офигенное ELA5 видео, где на пальцах объясняется модификация Attention из DeepSeek: MultiHead-Latent-Attention
— 📃 Жутковатая декабрьская папирка, в которой экспериментально показывают, что ризонинг модельки типа Open AI o1 умеют скрытно «избегать удаления», если им это угрожает, при этом всё ещё решая задачу пользователя как ни в чём не бывало