這是老梗了,現在看到感覺更好笑 XD
大一:在一個月就要其中考了耶
大二:下週就要其中考了耶
大三:明天有期中考!?
大四:幹!忘了考試!
軟體開發和生活瑣事
這是老梗了,現在看到感覺更好笑 XD
大一:在一個月就要其中考了耶
大二:下週就要其中考了耶
大三:明天有期中考!?
大四:幹!忘了考試!
只要有學校的電子郵件地址且有 0.5 學分以上的休息紀錄,就可以以優惠價格 $1990 購買 Office 2007 Ultimate。
微軟 – “終極高手 The Ultimate Student” 專案
http://www.microsoft.com/taiwan/education/ultimatesteal.htm
我已經買了,不過有幾點讓我很想砍人:
昨晚讓機器人爬資料,早上起來還嚇一跳,使用者數量約一萬左右,噗文數量約三萬,回覆數量則破十萬!該死的是資料庫編碼有問題,幾乎所有的資料都變成垃圾。
晚上對自己有追蹤的幾個使用者追蹤後,以「機器人回覆內容完全相同」為判斷依據,得到的是卡洛里小姐 「親愛的,晚安!」和女僕小C「主人 XX」的回覆最多。
話說我已經有好一陣子沒有碰 SQL 語法了,不知道這樣寫有沒有錯:
select a.content, a.user_id, b.nick_name, b.display_name, count(*) as 'repeat'
from p_reply a, p_user b
where a.user_id = b.user_id
group by content, user_id having count(*) >1
order by count(*) desc
ps. 欄位名稱同 RLplurkAPI 提供的欄位名稱
噗浪機器人實在太多了,原本也想自己寫一個會回覆使用者的機器人,不過感覺大同小異沒甚麼特別好玩的。一陣子以後發現廣告機器人越來越囂張,所以決定試著利用可取得的資料判斷何者為廣告機器人。
機器人一定是電腦,電腦就會有固定的行為模式,只是簡單或是複雜。例如最簡單的「晚安機器人」就會回覆完全相同的文字:
卡洛里小姐 說 親愛的,晚安!祝你有一個好夢唷!?..
複雜一點的可能會因使用者文字內容而改變內容,像是羊羊或是什麼星座機器人;另一種是專門轉貼文章的機器人,像是 pct 系列機器人和超級討厭的米窩機器人。這些要從文字判斷就非常麻煩。
目前寫了一個機器人自動爬噗浪並紀錄文字內容和未知的使用者,打算慢慢建立一套規則去分析文字和使用者尖的關係去找出廣告機器人。
不過計畫才開始二小時就發覺不太可行,我的機器人每三分鐘讀取噗浪一次,每次只讀取三個使用者的噗浪 (減少伺服器負擔),但是每次新增的使用者數量就超過三名,而且已等比級數在增加:32、64、84、170、242、704 …….!
爸爸之歌還真是簡短有力 XDDDDD