在Python中索引浮点值

我有一个从数据结构生成的浮点数列表,该数据结构是一个字典列表-即我已经遍历整个列表并在给定字典中选择了某些值.现在,我想对这些数据点进行实际操作,为此我需要参考原始位置.我试图简单地将数据点用作键,但是在尝试失败之后,我进行了一些挖掘,并意识到由于计算机的工作方式,浮点数不能精确表示.

因此,我需要某种方式为列表中的每个字典分配一个唯一值,例如:

list = [...]
vallist = []
index = {}
for i in range(0, len(list)):
value = i+0.123
vallist.append(value)
index[value] = i

除了我显然需要为每个值分配一个唯一项,以便能够指向它们在列表对象中的位置.我在想我可以创建一个名为“值列表”的新对象,然后对它进行int处理,但是这似乎有一个明显的解决方法,我实在太厚了,无法解决.

重申一下,我想要的是一种使值指向列表中原始位置的方法-在我的数据结构中,我的列表包含大量字典,而我处理它的方式有些复杂,所以我有点卡住了我可能不切实际的结构.

谢谢!

解决方法:

首先,让我们解决使用浮点数带来的问题.

floats aren’t precisely represented due to the way computers work.

浮点数可以在计算机中精确表示.但是,存在一些限制:

>分辨率是有限的.不可能在有限的内存中表示无理数,典型的浮点数只能表示几十个数字.
>一些十进制数(以10为基数)为have no exact representation in binary.例如,不能精确地以0.1为基数2表示0.1.在python中运行“ {0:.20f}”.format(0.1)将返回0.10000000000000000555.

现在,根据您的数字来源和您想要执行的计算类型,有不同的可能方法来为它们建立索引.

对于可以在base10中精确描述的数字,可以使用十进制.这恰好表示base10中的数字:

>>> from decimal import Decimal
>>> "{0:.20f}".format(Decimal('0.1'))
'0.10000000000000000000'

如果您只处理有理数(即使没有精确十进制表示的数),则可以使用fractions.

请注意,如果您使用小数或小数,则需要在处理中尽快使用它们.在后期从浮点数转换为小数/分数会破坏其目的-您无法获得不存在的数据:

>>> "{0:.20f}".format(Decimal('0.1'))
'0.10000000000000000000'
>>> "{0:.20f}".format(Decimal(0.1))
'0.10000000000000000555'

同样,使用小数或小数会严重影响性能.对于严重的数字运算,您将始终要使用浮点数,甚至是integers in their place

最后,如果您的数字不合理,或者即使在使用小数或小数时也遇到了索引错误,则最佳选择可能是为数字的舍入版本编制索引.如有必要,请使用buckets. collections.defaultdict可能对此有用.

您还可以保留一棵树,或在具有自定义比较功能的列表上使用binary search,但不会进行O(1)查找

上一篇:Mysql覆盖vs复合vs列索引


下一篇:如何在JavaScript中创建一个索引从1开始的数组?