我的问题如下:
有文件的间隔列表:
1 5
2 8
9 12
20 30
并且范围广泛
0 200
我想做这样一个交集,它将报告我在给定范围内的间隔之间的位置[开始结束].
例如:
8 9
12 20
30 200
除了任何想法如何咬这个,也很高兴阅读一些关于优化的想法,因为一如既往的输入文件将是巨大的.
解决方法:
此解决方案的工作时间间隔按起点排序,并且不需要创建与总范围一样大的列表.
码
with open("0.txt") as f:
t=[x.rstrip("\n").split("\t") for x in f.readlines()]
intervals=[(int(x[0]),int(x[1])) for x in t]
def find_ints(intervals, mn, mx):
next_start = mn
for x in intervals:
if next_start < x[0]:
yield next_start,x[0]
next_start = x[1]
elif next_start < x[1]:
next_start = x[1]
if next_start < mx:
yield next_start, mx
print list(find_ints(intervals, 0, 200))
输出:
(在您给出的示例中)
[(0, 1), (8, 9), (12, 20), (30, 200)]