下载telegram群组聊天消息

下载telegram群组聊天消息及统计方案:

1 创建机器人

在telegram应用里与BotFather交互创建机器人,参考链接:https://core.telegram.org/bots#6-botfather
发送/setjoingroups,设置机器人可以加入其他群组

2 把机器人加入群组
3 与BotFather交互发送 /setprivacy,禁用机器人的隐私模式以接收除其他机器人发送的消息之外的所有消息
4 通过api接收群组的聊天消息(机器人加入的群组)

api:https://api.telegram.org/bot<token>/getUpdates
创建机器人时BotFather会返回token,具体api方法getUpdates参考链接:https://core.telegram.org/bots/api#getupdates
api方法getUpdates返回值参考链接:https://core.telegram.org/bots/api#update

5 在永真循环里循环发送http请求,调用getUpdates接口,并把返回的每条群聊消息保存到数据库,
返回的每条消息都会有唯一标示update_id,update_id依次递增,并且有消息发送人的唯一标示id及发送时间,update_id作为对应消息保存在数据库记录的主键;
调用getUpdates接口时添加offset请求参数,参数值为数据库最大的update_id加一,接口返回的群聊消息的update_id大于等于offset,并且最多返回100条消息;
调用getUpdates接口添加了offset参数不会查询到重复的群聊消息同时也不会漏查群聊消息;数据库记录主键为update_id,重复的update_id无法插入数据库;
鉴于每次调用getUpdates接口最多返回100条消息及群聊消息在telegram服务器保留不超过24小时,永真循环里发送http请求调用getUpdates接口最大程度保证所有聊天消息都可以查出来;
6 做一个前端页面,输入指定文本及群聊消息时间区间,根据该文本模糊查询数据库指定时间区间的所有群聊消息记录,并根据消息发送人的唯一标示id分组,根据每组的记录总数递减排序,查询出所有发送了该指定文本的用户
7 摘自teleram官网的一些Java实现
TelegramBots. An easy to use library to create Telegram Bots.
https://github.com/rubenlagus/TelegramBots

JTelegramBot. A Java library that wraps Telegram Bot API with a simpler API using Builder design pattern.
https://github.com/Eng-Fouad/JTelegramBot

telegramBotUtilities. A simple java library that allows you to manage your telegram bots.
https://github.com/leocus/telegramBotUtilities

Java API for Bots and Gaming platform.
https://github.com/pengrad/java-telegram-bot-api

上一篇:Java 传参传值


下一篇:运维前线:一线运维专家的运维方法、技巧与实践2.2 开源CMDB介绍