近似算法的支配分析是一种估计算法性能的方法,由Glover和Punnen在1997年提出。与经典的近似比分析不同的是,支配分析是将计算出的解与最优解的数字质量进行比较,而支配分析则是考察计算出的解在所有可能的解中的排序情况。在这种分析方式中,如果存在一个由K个不同解决方案组成的子集,其中该算法的输出是最好的,那么就可以说该算法具有支配数或支配数K。支配分析也可以用支配率来表示,支配率是指不优于给定解决方案的解决方案空间的一部分;这个数字总是位于区间[0,1]内,更大的数字表示更好的解决方案。支配率分析最常被应用于已知可能解的总数且难以精确求解的问题。
例如,在旅行推销员问题中,有n个城市的问题实例有(n-1)!个可能的解决方案。如果一种算法可以被证明具有接近于(n-1)的支配数,或者等同于具有接近于1的支配率,那么它可以被认为比具有较低支配数的算法更好。
如果有可能有效地找到问题解决空间的随机样本,就像旅行推销员问题那样,那么对于随机算法来说,找到一个高概率的具有高支配率的解决方案是很简单的:只需构建一组样本并从中选择最佳解决方案。(见,例如,Orlin和Sharma)。)
这里描述的支配数不应与图的支配数相混淆,后者指的是图的最小支配集中的顶点数量。
最近,出现了越来越多的文章,其中支配力分析被应用于评估启发式方法的性能。这种分析可以被看作是与经典的近似比分析传统相竞争的。这两种措施也可以被看作是互补的。
在信息检索中,tf-idf、TF*IDF或TFIDF,是术语频率-反文档频率的简称,是一种数字统计,旨在反映一个词对集合或语料库中的文档的重要性。[1] 它经常被用作信息检索、文本挖掘和用户建模的搜索中的加权因素。tf-idf值与一个词在文档中出现的次数成比例增加,并被语料库中包含该词的文档数量所抵消,这有助于调整一些词在一般情况下出现频率较高的事实。 tf-idf是目前最流行的术语加权方案之一。2015年进行的一项调查显示,数字图书馆中83%的基于文本的推荐系统使用tf-idf[2] 。
tf-idf加权方案的变种经常被搜索引擎用作给用户查询的文档相关性打分和排名的核心工具。tf-idf可以成功地用于各种主题领域的止语过滤,包括文本总结和分类。
其中一个最简单的排名函数是通过对每个查询词的tf-idf相加来计算的;许多更复杂的排名函数是这个简单模型的变种。
锥齿轮中的节距角是指节距锥的一个元素与它的轴之间的角度。在外锥齿轮和内锥齿轮中,节距角分别小于和大于90度[1]。