一張五十首歌的歌單,每首歌三到五分鐘,隨機播放。至少聽多少分鐘才能有90%的把握把每首歌都聽過了?
01-21
「隨機播放」指的就是音樂軟體里的隨機播放模式。
「三到五分鐘」指歌曲時長服從(3min,5min)均勻分布假設我不快進不快退不暫停,一直聽今天聽歌時想到這個問題,覺得蠻有意思的,求解答或解答思路
寫了個程序來模擬。模擬時有如下假設:
- 模擬以秒為單位進行,一首歌的長度服從180s ~ 300s的離散均勻分布;
- 一首歌播放完畢後,以等概率選擇下一首歌;
- 歌曲的長度是事先未知的。實際上,哪怕是已經播放過的歌曲,再次播放時我仍然認為其長度是未知的。否則需要記住已經播放過的每首歌的長度,就麻煩了。
- 下標
表示還有多少首歌沒有開始播放,
;
- 下標
表示當前歌曲還剩下多少秒,
。
按上面定義,狀態表示剛剛播放完所有歌曲。
用表示
秒後狀態的概率分布。
- 對於任何
,
全部傳遞給
;
- 對於
,
,
中有
的比例平均分配給
至
(下一首播放的是新歌),有
的比例平均分配給
至
(下一首播放的是老歌);
全部傳遞給
。

這裡還有一個實際問題就是播放軟體往往是偽隨機……各首歌不是等概率出現的。
大家看看這樣做有沒有什麼問題呢?(見圖片)

聽N首之後還沒有聽過第i首歌的概率是
當然還有一層tail bound,也就是播放時間,342首歌的播放時間的話應該和Gaussian差不多了(嚴格的話換用Hoeffding"s inequality),期望是
4*342=1368min, 標準差 sqrt(342/3) min, 3個sigma差不多,所以聽1368+11*3= 1401min時有95%的概率聽完342首歌。再用一次union bound,在聽過1401分鐘之後至少有90%概率聽過所有歌。
並不緊,不過提升空間不大了。。
現在的播放器是不重的擦汗

你們都是神嗎?
亂答一通。請指正。
播放n首歌曲的總耗時大致符合高斯分布,有概率密度函數
.
P[消耗時間不超過|播放n首歌曲]=
播放n首歌曲之後有k首已經聽過的概率是
消耗時間不超過T,恰好有50首聽過的概率是
請問哪個音樂播放軟體的隨機播放一直不停地放會重複播放放過的歌?所以不懂都在算些什麼
推薦閱讀:
※伽瑪分布和指數分布的關係?
※誰能比較淺顯易懂地解釋下Restricted Boltzmann Machine,或者提供相關的鏈接?
※一群人同時咳嗽的機率有多大?
※廣義線性模型(GLM)中的Binomial分布的連接函數為什麼是logit?
※如何計算空方格數的期望?
