來源:巨靈鳥軟件 作者:進銷存軟件 發布:2019/9/15 瀏覽次數:3741
你可能會問:為什么 12306 這么摳呢?它大方地讓爬蟲隨意爬會死嗎?
答:會死。
你知道每年過年之前,12306 被點成什么樣了嗎?公開數據是這么說的:“最高峰時1天內頁面瀏覽量達813.4億次,1小時最高點擊量59.3億次,平均每秒164.8萬次。”這還是加上驗證碼防護之后的數據。可想而知被攔截在外面的爬蟲還有多少。況且這里還沒有討論,被搶票軟件把票搶走,對我們父母那樣的不會搶票的人來說,是不是公平呢?鐵路被爬蟲“點雞”成這樣已經夠慘了,但它還有個難兄難弟,就是航空。而航空里,被搞得最慘的不是國航,不是海航,也不是東航。而是亞航。
很多人可能都沒坐過亞洲航空。這是一家馬來西亞的廉價航空公司,航線基本都是從中國各地飛往東南亞的旅游勝地,飛機上連礦泉水都得自費買,是屌絲窮X度假之首選。為什么爬蟲這么青睞亞航呢?因為它便宜。確切地說,因為它經常放出便宜的票。本來,亞航的初衷只是隨機放出一些便宜的票來吸引游客,但這里面黃牛黨是有利可圖的。據我所知,他們是這樣玩的:技術宅黃牛黨們利用爬蟲,不斷刷新亞航的票務接口,一旦出現便宜的票,不管三七二十一先拍下來再說。亞航有規定,你拍下來半小時(具體時間記不清了)不付款票就自動回到票池,繼續賣。但是黃牛黨們在爬蟲腳本里寫好了精確的時間,到了半小時,一毫秒都不多,他又把票拍下來,如此循環。直到有人從黃牛黨這里定了這個票,黃牛黨就接著利用程序,在亞航系統里放棄這張票,然后0.00001秒之后,就幫你用你的名字預定了這張票。“我是中間商,我就要賺差價!”這波騷操作,堪稱完美。2、排名第二的是社交社交的爬蟲重災區,就是你們喜聞樂見的微博。給你看張圖:
這是爬蟲經常光顧的微博地址。這里的代碼其實指向了微博的一個接口。它可以用來獲取某個人的微博列表、微博的狀態、索引等等等等。獲得這些,能搞出什么騷操作呢?你想想看,如果我能隨心所欲地指揮一幫機器人,打開某人的微博,然后刷到某一條,然后瘋狂關注、點贊或者留言,這不就是標準的僵尸粉上班兒的流程么。。。其實,僵尸粉都只是爬蟲的常規操作,更騷的來了:
1、我是一個路人甲,我的微博沒人關注,我用大量的爬蟲,給自己做了十萬人的僵尸粉,一群僵尸在我的微博下面點贊評論,不亦樂乎。
2、我去找一個游戲廠商,跟他說:你看我有這么多粉絲,你在我這投廣告吧。我幫你發一條游戲的注冊鏈接,每有一個人通過我的鏈接注冊了游戲,你就給我一毛錢。廣告主說,不錯,就這么辦。
3、我發出注冊鏈接,然后沒人點。。。
4、不慌,我讓十萬爬蟲繼續前赴后繼地點擊注冊鏈接,然后自動去完成注冊動作。
5、我躺在床上,數著賺來的一萬塊錢。(以上數據不一定和現實吻合,只是展現一個邏輯。具體操作也會更復雜。)還有更騷的么?有的。你家愛豆不是經常在微博上發紅包么?好的,我率十萬僵尸粉去搶。
憑本事搶來的紅包,就問你有什么不妥嗎?3、排名第三的是電商你回憶一下,有幾種東西叫做“比價平臺”“聚合電商”和“返利平臺”。他們大體都是一個原理:你搜索一樣商品,這類聚合平臺就會自動把各個電商的商品都放在你面前供你選擇。有淘寶、京東,還有唯品會蘇寧易購。這就是爬蟲的功勞。它們去淘寶上,把胖次襪子杜蕾斯的圖片和價格統統扒下來,然后在自己這里展示。
這個原理和谷歌差不多。只不過他們展示的不是網頁而是商品。但是被放在一起比價,淘寶是拒絕的,京東也是拒絕的啊。。。然鵝,由于機器爬蟲模擬的是人的點擊,電商很難阻止這類事情發生。他們甚至都不能向12306學習。你想想看,如果你每點開一個商品詳情,淘寶都讓你先分辨一次白百何和王珞丹,你肯定沒心情剁手,沒準還要提刀去剁馬云呢。。。當然,電商對抗爬蟲有另外的方法,那就是“web 應用防火墻”,簡稱 WAF。這個我們后面再單獨說。說到這,有童鞋會有個疑問:那些聚合平臺,自己寫爬蟲,然后幫助淘寶京東賣貨,他們的名字叫雷鋒么?醒醒啊同學,雷鋒叔叔已經走了很多年了。我隨便給你說一下這種聚合電商平臺的盈利模式:
1、假設幾家店鋪都賣杜蕾斯,但是用戶在我這里搜索“杜蕾斯”的時候,我是有權利決定誰的店鋪在前面誰在后面的啊。誰給的錢多,我就讓誰在搜索的前面唄。@百度君,你說說是不是這個道理?(注意,每個店鋪和淘寶平臺可不是一致行動人。淘寶平臺不希望自己的內容被聚合平臺抓取,但每個店鋪可是很樂意多一個渠道幫他們賣貨的。)
2、如果你覺得搞競價排名良心會痛,也可以用更簡單的方式——在網頁上展示獨立的廣告。訪問你網站的用戶,看到頁面上的廣告,也有可能會點擊。每點擊一次,你就賺一次錢。
3、你還可以作為中間商,收點中介費。我幫你店家賣貨了,你是不是要給我意思意思。除了給我意思意思,你還得給來買東西的用戶意思意思。這種套路,就是“返利網”這類平臺的玩法。
來源:巨靈鳥 歡迎分享本文
上一個文章:技術一旦被用來作惡,究竟會有多可怕(三)
下一個文章:技術一旦被用來作惡,究竟會有多可怕(一)