3.6Kпросмотров
17 декабря 2025 г.
Score: 3.9K
Вчера на финальной лекции курса DL в МГУ один из студентов задал вопрос про байесовский подход в машинном обучении. Тема, несомненно, интересная, и когда-нибудь мы до нее доберемся. Но для начала разберемся с основами :) Линейную алгебру мы уже чуть-чуть затронули, а теперь настало время теории вероятностей🎲. И, честно говоря, наша интуиция в вопросах вероятностей частенько сбоит 🤯 Начнем с самого простого. Что такое верояность? Это просто доля исходов (например, успешных) от общего числа возможных (ограничимся пока ситуациями, где число возможных исходов конечно). Честная монетка падает орлом в 1 случае из 2 (P=0.5).
Кубик показывает шестерку в 1 случае из 6. Вроде очевидно. Исход бросания монетки, кубика, подачи на работу (как в том анекдоте) – случайная величина.
Но случайные величины могут взаимодействовать. И результат взаимодействия двух случайных величин... правильно, тоже случайная величина. И вот тут у интуиции начинаются сложности. Ну и два важных факта, пока мы не двинулись дальше:
1. Сумма вероятностей всех исходов всегда равна единице (=100%)! Любой исход – доля среди всех возможных. Сумма всех долей дает все пространство исходов, т.е. 100% вероятность. 2. Вероятности независимых событий перемножаются! Пусть дождь идет с вероятностью 10%, а господин N ест колбасу на завтрак с вероятностью 17%. Тогда в случайный день вероятность того, что сегодня идет дождь и он завтракает колбасой будет 1.7%. Давайте разберем популярный пример: Парадокс дней рождений🎂 Предположим, вы собрались с коллегами на новогоднем корпоративе. Сколько человек нужно, чтобы вероятность того, что у двоих совпадут дни рождения, перевалила за 50%? А за 99%? Интуиция подсказывает: в году 365 дней, значит, нужно где-то половину... ну, человек 180? Или хотя бы 100? Правильный ответ: для 50% нужно всего 23 человека. А для 99% – 57 человек. Почему так мало🧐? Решение можно объяснить почти на пальцах: Пронумеруем людей любым доступным образом и представим себе, что каждый называет свой день рожденья. Если он уже был назван – день занят, иначе свободен. Первый человек "занимает" свой день рождения и он свободен со 100% вероятностью.
Второй попадет на свободную дату с вероятностью 364/365, ведь один день занят.
Третий – уже с вероятностью 363/365, ведь заняты 2.
...
23 попадает с вероятностью (365-23+1)/365. Даты рождения людей независимы – все люди рождались в случайные дни относительно друг друга. А значит, вероятность того, что никакие дни рождений не совпали будет равна
365/365 364/365 363/365 ... (365-23+1)/365 = 0.49 = 49% А значит, вероятность, что хотя бы какие-то даты совпали есть 1 - 0.49 = 0.51 = 51% В следующем посте разберем знаменитую задачу, которую упоминали даже в кино. А кто понял, о какой задаче речь – пишите в комментарии под спойлером 😉 @rads_ai