文章按给定权重、生成时间综合排序

做CMS系统时,经常会有一个需求,将文章按时间、以及管理员给定的权重值进行排序显示的需求。之前自己有写过一个排序的公式,已经用了一段时间了,感觉还不错,这里跟大家分享一下。

特点

该排序公式的特点

  1. 权重值(weight)处于[0, 100]区间
  2. 结果值处于[0, 100]区间
  3. 时间(created)越早排序值越小

对于时间对结果值影响,受设定的衰退率(DECLINE_RATE)、晒退周期(DECLINE_CYCLE)、缩放率(LINEAR_SCALE)、时间压缩率控制(TIME_COMPRESS_RATE),分别有如下规律:

  1. 衰退率(从区间(0, 1)取值,当前设定值DECLINE_RATE=0.9)越大,结果值越小(衰退越快)
  2. 衰退周期(当前设定值为108天,即DECLINE_CYCLE=86400 * 108)越大,结果值越大(衰退越慢)
  3. 线性级缩放率(从区间(1, 无穷)取值,当前设定值LINEAR_SCALE=25)越大,结果值越小(衰退越快)
  4. 时间压缩率(从区间(1, 无穷)取值,当前设定值TIME_COMPRESS_RATE=5)越大,对时间的压缩率越大,导致不同时间的结果值越接近(小于衰退周期时,衰退越慢;大于衰退周期时,衰退越快)

SQL表示

SELECT
tb.*,
(tb.`weight` - 
tb.`weight` * 
POW(DECLINE_RATE, LINEAR_SCALE / POW((UNIX_TIMESTAMP(NOW()) - tb.`created`) / DECLINE_CYCLE, 1.0 / TIME_COMPRESS_RATE))) AS compute_rank
FROM
`my_cms_table` tb
ORDER BY
compute_rank DESC,
tb.`created` DESC

上式中,当前设定的DECLINE_RATE=0.9DECLINE_CYCLE=86400 * 108LINEAR_SCALE=25TIME_COMPRESS_RATE=5,字段weight表示权重,字段created表示文章创建的时间(这里是bigint类型,单位秒),UNIX_TIMESTAMP是MySQL中将时间转为数值(单位秒)的函数,NOW是MySQL中取当前时间的函数,POW是MySQL中的指数函数。公式用数学函数可表示为(当前时间用CURRENT_TIME表示)

f(weight, created) = weight - weight * ( DECLINE_RATE ^ ( LINEAR_SCALE / ( ((CURRENT_TIME-created)/DECLINE_CYCLE)^(1/TIME_COMPRESS_RATE)) ) )

应用

对于一些特殊的需求,要求按照文章的点击量排序,而非管理员给定的权重排序。这时,应该考虑将点击量映射到到weight字段的取值区间,并替代weight字段。如:考虑使用底数小于1的指数函数,映射规则为weight = 100 * (1 - 0.99 ^ (hits + 1))) ,其中hits表示点击量(建议点击量还要缩小一定的倍数,降低点击量的量级),后面的加1为了保证所有weight能够有足够大的值

文章按给定权重、生成时间综合排序文章按给定权重、生成时间综合排序 Vincent_Field 发布了39 篇原创文章 · 获赞 22 · 访问量 7万+ 私信 关注
上一篇:抽奖权重算法


下一篇:TensorFlow+FaceNet+GPU训练模型(超详细过程)(四、模型训练)