Tag标签系统设计

转一篇关于tag的文章:

 《Tagging: People-powered Metadata for the Social Web》出版于2008年,中文版译为《标签:标记系统设计实践》.Tag,RSS都是Web 2.0时代的标志性建筑.这本书就Tag的方方面面做了比较全面的分析,但是有些章节内容组织逻辑上有点问题,瑕不掩瑜.笔记如下:
 

分面分类

   "缤纷色彩闪出的美丽,是因它没有分开每种色彩",黄家驹歌里唱出世界因为差异不同而丰富多彩;每个人认知世界的方式也不同,分类也好,各种榜单也好,本质上讲都是偏见而已;我们在图书馆里面按照中图分类法进行文献检索,但是如果做一个实验让一群人围100部电影进行分类,一模一样的分类方式估计会很少;人与人不同, 信息的分类组织方式其实也是一种自我表达的方式.
 
     我们现在计算机上使用的文件夹方式组织文件;这种组织方式其实就是把传统信息目录组织方式在计算机中的实现,但是这种组织的方式就是把信息按照层次结构进行组织,但是没有解决一个事物属于多个分类的问题;虽然,快捷方式可以作为一个解决方案;
比如:我电脑上所有的罗大佑的歌曲,我想按照曲风,时间,演唱会,词曲作者,等方式组织,可实际上我只能按照音乐专辑的方式组织;更不要说,我还想把这些音乐归入"滚石音乐","国语粤语双版","电影原声"等突发奇想的分类了;
 
   分面分类法允许从不同的维度去描述同一个事物;像上面,我们可以从不同的角度对同一个音乐作品进行分类;这是符合我们认知规律的.在互联网产品中,这种解放了个人话语权的应用方式就是:Tag
 

什么是Tag

 
  Tag本质上是资源的元数据(metadata),元数据是用来描述,解释,定位信息源,或者使其易于获取,使用,管理的结构化信息.下图是Tag系统的构成:
Tag标签系统设计

标记为什么重要?

 
   这里作者提到的两点是不能成立的:(1)标记很流行 (2)标记是灵活的 "流行"是结果不是原因,因为需要所以重要,因为需要的多,所以流行;而灵活只是标签的自身属性,不能成为其重要的理由;下面几条是成立的:
 
[1]  同一个事物可以在不同的位置,不同的概念中存在;
[2]  用户添加Tag的最主要目的就是为了方便找到 个人信息管理 社会化信息管理
[3]  我们正在经历信息爆炸需要新的工具适应新的信息环境;微博,G+等流信息的传播形式,适用预定义的结构组织信息几乎不可能,Tag标记可以对流信息进行实时分类标注,不必考虑分类的层次关系;Tag在这种应用场景中给予我们最大的组织能力和最小的认知负荷;
 

用户添加Tag的动机

 
[1] 管理个人信息 
   用户添加Tag是有其本身需要的,不要割裂用户和Tag之间的关系;
[2] 自我表达
 
[3] 协作与分享
用户标记了一个东西希望与其他人产生互动的原因是:
(1) 抛砖引玉 希望其他用户发布同样的内容,其他用户可能是专家,获得专业意见
(2) 坐享其成 使用其他用户的标签,省去了收集整理分类的过程
(3) 寻找趣味相投的人
   
     这里作者说用户添加Tag的动机中"易用性"是不成立的:一个功能容易用就会有吸引力驱动用户去用么?一个简单的例子,指纹打卡机再易用,也没有多少人愿意打卡;这个不成立;易用性只是在用户需要用的前提下,降低了用户使用的难度;换个角度,"易用性"这明显是一个比较概念,是和谁比较呢?
 
 

商业回报

[1] 利用用户认知盈余低成本创建公共知识库
[2] 获得描述性元数据
[3] 识别模式 了解你的内容,用户,需求
[4] 补充现有分类(中文版译为"强化",补充和强化还是两回事)
 

面临的问题

 
[1] 系统建立之初的冷启动问题
    解决方法:(1)内测预热 (2)引导积极用户 (3)激励:虚拟或实物奖励
 
[2] 标签质量良莠不齐
   解决方法: (1) 改进界面 (2)建立社区规则 (3)人工介入或自动处理隐藏低质量内容
 
[3] 少数人的声音主导系统
   解决方法:(1)调整热度算法:去掉最高 最低, 高频降权 (2)防止自动提交
   "少数元素高频出现,大多数低频出现"的幂律曲线在生活中的例子就是二八定律,而且还有一个马太效应会强化这种规律.

Tag标签系统设计

[4] 标签审查 
  解决方法: 自动过滤 用户举报
   

应用举例

    个人信息管理比如Gmail中的Lable;
    社会化标记:豆瓣的标记系统
    电子商务为产品添加标记,增加产品的可寻性;
    书中提到的ESP的例子,其实在中文社区也有类似的应用比如:豆瓣的音乐基因;体验地址:http://labs.douban.com/doublo/
 

转自:http://www.cnblogs.com/me-sa/archive/2012/07/01/tag-tagging.html

http://www.ifanybug.com/article/00119.html

http://www.dewen.org/q/698/%E5%A6%82%E4%BD%95%E8%AE%BE%E8%AE%A1%E4%B8%80%E6%AC%BE%E9%AB%98%E6%95%88%E7%9A%84TAG%E7%B4%A2%E5%BC%95%E7%B3%BB%E7%BB%9F

[1] 管理个人信息

   用户添加Tag是有其本身需要的,不要割裂用户和Tag之间的关系;
[2] 自我表达
 
[3] 协作与分享
用户标记了一个东西希望与其他人产生互动的原因是:
(1) 抛砖引玉 希望其他用户发布同样的内容,其他用户可能是专家,获得专业意见
(2) 坐享其成 使用其他用户的标签,省去了收集整理分类的过程
(3) 寻找趣味相投的人
   
     这里作者说用户添加Tag的动机中"易用性"是不成立的:一个功能容易用就会有吸引力驱动用户去用么?一个简单的例子,指纹打卡机再易用,也没有多少人愿意打卡;这个不成立;易用性只是在用户需要用的前提下,降低了用户使用的难度;换个角度,"易用性"这明显是一个比较概念,是和谁比较呢?
 
 

商业回报

[1] 利用用户认知盈余低成本创建公共知识库
[2] 获得描述性元数据
[3] 识别模式 了解你的内容,用户,需求
[4] 补充现有分类(中文版译为"强化",补充和强化还是两回事)
 

面临的问题

 
[1] 系统建立之初的冷启动问题
    解决方法:(1)内测预热 (2)引导积极用户 (3)激励:虚拟或实物奖励
 
[2] 标签质量良莠不齐
   解决方法: (1) 改进界面 (2)建立社区规则 (3)人工介入或自动处理隐藏低质量内容
 
[3] 少数人的声音主导系统
   解决方法:(1)调整热度算法:去掉最高 最低, 高频降权 (2)防止自动提交
   "少数元素高频出现,大多数低频出现"的幂律曲线在生活中的例子就是二八定律,而且还有一个马太效应会强化这种规律.
 
 
上一篇:Spark Client和Cluster两种运行模式的工作流程


下一篇:Projective Texture的原理与实现 【转】