微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

从tzdata提取历史leap秒

如何解决从tzdata提取历史leap秒

我只是做了一下man 5 tzfile,计算了一个偏移量,该偏移量将找到the秒信息,然后读取the秒信息。

您可以取消注释“ DEBUG:”打印语句,以查看它在文件中找到的更多内容

编辑:程序更新为现在正确。现在/usr/share/zoneinfo/right/UTC,它使用该文件,并且现在找到要打印的leap秒。

原始程序并未跳过在手册页中记录的timezeone缩写字符,但有些隐藏(“ …,并且tt_abbrind充当时区缩写字符数组的索引,该数组遵循ttinfo结构中的文件。”)。

import datetime
import struct

TZFILE_MAGIC = 'TZif'.encode('US-ASCII')

def leap_seconds(f):
    """
    Return a list of tuples of this format: (timestamp, number_of_seconds)
        timestamp: a 32-bit timestamp, seconds since the UNIX epoch
        number_of_seconds: how many leap-seconds occur at timestamp

    """
    fmt = ">4s c 15x 6l"
    size = struct.calcsize(fmt)
    (tzfile_magic, tzfile_format, ttisgmtcnt, ttisstdcnt, leapcnt, timecnt,
        typecnt, charcnt) =  struct.unpack(fmt, f.read(size))
    #print("DEBUG: tzfile_magic: {} tzfile_format: {} ttisgmtcnt: {} ttisstdcnt: {} leapcnt: {} timecnt: {} typecnt: {} charcnt: {}".format(tzfile_magic, tzfile_format, ttisgmtcnt, ttisstdcnt, leapcnt, timecnt, typecnt, charcnt))

    # Make sure it is a tzfile(5) file
    assert tzfile_magic == TZFILE_MAGIC, (
            "Not a tzfile; file magic was: '{}'".format(tzfile_magic))

    # comments below show struct codes such as "l" for 32-bit long integer
    offset = (timecnt*4  # transition times, each "l"
        + timecnt*1  # indices tying transition time to ttinfo values, each "B"
        + typecnt*6  # ttinfo structs, each stored as "lBB"
        + charcnt*1)  # timezone abbreviation chars, each "c"

    f.seek(offset, 1) # seek offset bytes from current position

    fmt = '>{}l'.format(leapcnt*2)
    #print("DEBUG: leapcnt: {}  fmt: '{}'".format(leapcnt, fmt))
    size = struct.calcsize(fmt)
    data = struct.unpack(fmt, f.read(size))

    lst = [(data[i], data[i+1]) for i in range(0, len(data), 2)]
    assert all(lst[i][0] < lst[i+1][0] for i in range(len(lst)-1))
    assert all(lst[i][1] == lst[i+1][1]-1 for i in range(len(lst)-1))

    return lst

def print_leaps(leap_lst):
    # leap_lst is tuples: (timestamp, num_leap_seconds)
    for ts, num_secs in leap_lst:
        print(datetime.datetime.utcfromtimestamp(ts - num_secs+1))

if __name__ == '__main__':
    import os
    zoneinfo_fname = '/usr/share/zoneinfo/right/UTC'
    with open(zoneinfo_fname, 'rb') as f:
        leap_lst = leap_seconds(f)
    print_leaps(leap_lst)

解决方法

有没有办法从大多数Linux发行版中分发的时区数据库中提取历史of秒的时刻?我正在寻找python中的解决方案,但是在命令行上运行的任何东西也都可以。

我的用例是在gps-time(这基本上是自1980年启用第一个GPS卫星以来的秒数)和UTC或本地时间之间进行转换。UTC时不时调整为leap秒,而gps-
time则线性增加。这等效于在UTC和TAI之间进行转换。TAI也忽略leap秒,因此TAI和gps-
time应该始终以相同的偏移量发展。在工作中,我们使用gps-time作为同步世界各地天文观测的时间标准。

我有在gps-time和UTC之间转换的工作函数,但我必须对to秒表进行硬编码,该表已在此处(文件tzdata2013xx.tar.gz包含名为的文件leapseconds)。当宣布新的leap秒时,我必须每隔几年手动更新此文件。我希望从标准tzdata获取此信息,该数据每年会通过系统更新自动更新一次。

我很确定信息会隐藏在中的某些二进制文件中 /usr/share/zoneinfo/。我已经能够使用struct.unpackman tzfile提供有关格式的一些信息)提取其中的一些内容,但是我从未完全使用过它。是否有任何标准软件包可以访问此信息?我知道pytz,它似乎是从同一数据库中获取标准DST信息的,但是它并不能访问leap秒。我还找到了tai64n,但查看其源代码,它仅包含一个硬编码表。

编辑

受steveha的回答和pytz /
tzfile.py中的
一些代码的启发,我终于得到了一个可行的解决方案(在py2.5和py2.7上进行了测试):

from struct import unpack,calcsize
from datetime import datetime

def print_leap(tzfile = '/usr/share/zoneinfo/right/UTC'):
    with open(tzfile,'rb') as f:
        # read header
        fmt = '>4s c 15x 6l'
        (magic,format,ttisgmtcnt,ttisstdcnt,leapcnt,timecnt,typecnt,charcnt) =  unpack(fmt,f.read(calcsize(fmt)))
        assert magic == 'TZif'.encode('US-ASCII'),'Not a timezone file'
        print 'Found %i leapseconds:' % leapcnt

        # skip over some uninteresting data
        fmt = '>%(timecnt)dl %(timecnt)dB %(ttinfo)s %(charcnt)ds' % dict(
            timecnt=timecnt,ttinfo='lBB'*typecnt,charcnt=charcnt)
        f.read(calcsize(fmt))

        #read leap-seconds
        fmt = '>2l'
        for i in xrange(leapcnt):
            tleap,nleap = unpack(fmt,f.read(calcsize(fmt)))
            print datetime.utcfromtimestamp(tleap-nleap+1)

结果

In [2]: print_leap()
Found 25 leapseconds:
1972-07-01 00:00:00
1973-01-01 00:00:00
1974-01-01 00:00:00
...
2006-01-01 00:00:00
2009-01-01 00:00:00
2012-07-01 00:00:00

尽管这确实解决了我的问题,但我可能不会寻求该解决方案。取而代之的是,如Matt Matt所建议的,我将在自己的代码中包含jump-
seconds.list
。这似乎是用作tzdata来源的权威列表,并且可能由NIST每年更新两次。这意味着我将必须手动进行更新,但是此文件易于解析,并且包含一个有效日期(似乎缺少tzdata)。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。