大數據算出“異常出行行為” 小小公交卡或能讓小偷“現形”
全國公安交管部門已經在新浪微博開通認證了4300余個賬號,日均發布微博數量超過1.5萬條;公交卡大數據今后可能會抓住城市九成以上的小偷;南京蘇州已經成為全國智能出行發展城市十強城市……近日由公安部交通管理科學研究所、高德地圖等機構聯合主辦的“互聯網+交通出行服務”論壇上,專家介紹說,未來交通大數據的應用將會給百姓帶來更多“不可能”的方便。
公交卡信息如何“算出”小偷
根據公交卡的大數據,能夠篩選出九成以上的疑似小偷,這是怎么做到的?有參加論壇的專家介紹說,現在我們結合公交車GPS數據、乘客刷卡信息等數據,能夠獲取每輛公交車每個站點停車時間、上下車乘客數量、乘客精細時空軌跡等,可以做“公交車線路、站點、發車頻次優化”、“典型居住區和就業地的通勤出行分析”等分析。
A
驗證原理:絕大多數乘客乘坐公交車或地鐵出行時,會選擇最優出行方案,要么用時最短,要么換乘次數最少;但有極少數人的乘車路線很奇怪,比如會繞行一大圈或者突然改變乘車路線,沒有什么規律可言,如果某人的異常行為足夠多,那么他有可能是小偷。
B
研究過程:此前發布的這一成果是一項大學教授做的研究,在一次國際會議上公布過成果。以北京為例,研究人員分析了兩個月約16億次公交卡刷卡數據記錄,共涉及約600萬名乘客。
第一步,研究者把北京劃分為居住、工作、教育、購物、娛樂、醫療等多個小功能區塊,建立起包括896條公交路線、近4.5萬個公交車站與18條地鐵路線、320個地鐵站的公共交通網絡數據集,通過數據建模從龐大的公交卡記錄中過濾掉普通乘客。
第二步,結合從警方報告和微博上收集到的失竊信息,通過機器學習算法從異常出行信息中挖掘出潛在的小偷。
實驗結果:上述方法中被歸為“行為異常”者,之后被確認為小偷的驗證率高達92.7%。可是,如果小偷頻繁換用公交卡呢?據研究此項目的專家表示,就算換卡也有辦法,比如小偷經常團伙活動,這也是一個明顯的特征。
C
質疑聲音:不過也有人表示,人的活動是十分復雜和偶然的,也許乘客心情不好,或者坐過站回頭、臨時改變行程等等,都有可能出現行為異常,不能都判定為小偷吧。
                                        
                                        
                                        
                                        
                                        


