做CMS系统时,经常会有一个需求,将文章按时间、以及管理员给定的权重值进行排序显示的需求。之前自己有写过一个排序的公式,已经用了一段时间了,感觉还不错,这里跟大家分享一下。
特点
该排序公式的特点
- 权重值(weight)处于[0, 100]区间
- 结果值处于[0, 100]区间
- 时间(created)越早排序值越小
对于时间对结果值影响,受设定的衰退率(DECLINE_RATE)、晒退周期(DECLINE_CYCLE)、缩放率(LINEAR_SCALE)、时间压缩率控制(TIME_COMPRESS_RATE),分别有如下规律:
- 衰退率(从区间
(0, 1)
取值,当前设定值DECLINE_RATE=0.9
)越大,结果值越小(衰退越快) - 衰退周期(当前设定值为108天,即
DECLINE_CYCLE=86400 * 108
)越大,结果值越大(衰退越慢) - 线性级缩放率(从区间
(1, 无穷)
取值,当前设定值LINEAR_SCALE=25
)越大,结果值越小(衰退越快) - 时间压缩率(从区间
(1, 无穷)
取值,当前设定值TIME_COMPRESS_RATE=5
)越大,对时间的压缩率越大,导致不同时间的结果值越接近(小于衰退周期时,衰退越慢;大于衰退周期时,衰退越快)
SQL表示
SELECT
tb.*,
(tb.`weight` -
tb.`weight` *
POW(DECLINE_RATE, LINEAR_SCALE / POW((UNIX_TIMESTAMP(NOW()) - tb.`created`) / DECLINE_CYCLE, 1.0 / TIME_COMPRESS_RATE))) AS compute_rank
FROM
`my_cms_table` tb
ORDER BY
compute_rank DESC,
tb.`created` DESC
上式中,当前设定的DECLINE_RATE=0.9
,DECLINE_CYCLE=86400 * 108
,LINEAR_SCALE=25
,TIME_COMPRESS_RATE=5
,字段weight
表示权重,字段created
表示文章创建的时间(这里是bigint类型,单位秒),UNIX_TIMESTAMP
是MySQL中将时间转为数值(单位秒)的函数,NOW
是MySQL中取当前时间的函数,POW
是MySQL中的指数函数。公式用数学函数可表示为(当前时间用CURRENT_TIME
表示)
f(weight, created) = weight - weight * ( DECLINE_RATE ^ ( LINEAR_SCALE / ( ((CURRENT_TIME-created)/DECLINE_CYCLE)^(1/TIME_COMPRESS_RATE)) ) )
应用
对于一些特殊的需求,要求按照文章的点击量排序,而非管理员给定的权重排序。这时,应该考虑将点击量映射到到weight
字段的取值区间,并替代weight
字段。如:考虑使用底数小于1的指数函数,映射规则为weight = 100 * (1 - 0.99 ^ (hits + 1)))
,其中hits
表示点击量(建议点击量还要缩小一定的倍数,降低点击量的量级),后面的加1为了保证所有weight能够有足够大的值