Skip to content

Zeroplex 生活隨筆

軟體開發、伺服器和生活瑣事

小 縮小字型大小。 中 重設字型大小。 大 放大字型大小。

噗浪回覆分析

Posted on 2009 年 10 月 29 日2021 年 3 月 12 日 By 日落 在〈噗浪回覆分析〉中尚無留言

昨晚讓機器人爬資料,早上起來還嚇一跳,使用者數量約一萬左右,噗文數量約三萬,回覆數量則破十萬!該死的是資料庫編碼有問題,幾乎所有的資料都變成垃圾。

晚上對自己有追蹤的幾個使用者追蹤後,以「機器人回覆內容完全相同」為判斷依據,得到的是卡洛里小姐 「親愛的,晚安!」和女僕小C「主人 XX」的回覆最多。

話說我已經有好一陣子沒有碰 SQL 語法了,不知道這樣寫有沒有錯:

select a.content, a.user_id, b.nick_name, b.display_name, count(*) as 'repeat' 
from p_reply a, p_user b 
where a.user_id = b.user_id 
group by content, user_id having count(*) >1 
order by count(*) desc

ps. 欄位名稱同 RLplurkAPI 提供的欄位名稱

Tags:生活雜記

文章導覽

Previous Post: 噗浪機器人
Next Post: 微軟「終極高手 The Ultimate Student」專案

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *


其他

關於我  (About me)

小額贊助

  文章 RSS Feed

  留言 RSS Feed

Apache AWS Bash C/C++ Docker FreeBSD GCP Git Google Java JavaScript Laravel Linux Microsoft MSSQL MySQL Nginx PHP PHPUnit PostgreSQL Python Qt Ubuntu Unix Vim Web Windows WordPress XD 作業系統 分享 好站推薦 專題 攝影 新奇搞笑 新聞 旅遊 生活雜記 程式設計 網路架站 網頁設計 資訊學習 資訊安全 遊戲 音樂


創用 CC 授權條款
本著作係採用創用 CC 姓名標示-相同方式分享 4.0 國際 授權條款授權.