是否有可能在sql-Query中执行类似的操作?也许提供一个列表作为输入参数?
我想要的日期是连续的,但数据库中并不存在所有日期.如果日期不存在,则结果应为“无”.
dates = [dt.datetime(2008,1,1), dt.datetime(2008,1,2), dt.datetime(2008,1,3), dt.datetime(2008,1,4), dt.datetime(2008,1,5)]
id = "361-442"
result = []
for date in dates:
curs.execute('''SELECT price, date FROM prices where date = ? AND id = ?''', (date, id))
query = curs.fetchall()
if query == []:
result.append([None, arg])
else:
result.append(query)
解决方法:
要在sqlite中执行所有工作,可以使用LEFT JOIN用None填写缺失的价格:
sql='''
SELECT p.price, t.date
FROM ( {t} ) t
LEFT JOIN price p
ON p.date = t.date
WHERE p.id = ?
'''.format(t=' UNION ALL '.join('SELECT {d!r} date'.format(d=d) for d in date))
cursor.execute(sql,[id])
result=cursor.fetchall()
但是,此解决方案需要在Python中形成(可能)巨大的字符串,以便创建所有所需日期的临时表.它不仅速度慢(包括创建临时表需要sqlite的时间)它也很脆弱:如果len(date)大于500,那么sqlite会引发
OperationalError: too many terms in compound SELECT
如果您已在其他表格中拥有所有所需日期,则可能可以解决此问题.然后你可以用上面的丑陋的“UNION ALL”sql替换
就像是
SELECT p.price, t.date
FROM ( SELECT date from dates ) t
LEFT JOIN price p
ON p.date = t.date
虽然这是一个改进,但我的timeit测试(见下文)表明,在Python中完成部分工作仍然更快:
在Python中完成部分工作:
如果您知道日期是连续的,因此可以表示为范围,那么:
curs.execute('''
SELECT date, price
FROM prices
WHERE date <= ?
AND date >= ?
AND id = ?''', (max(date), min(date), id))
否则,如果日期是任意的,那么:
sql = '''
SELECT date, price
FROM prices
WHERE date IN ({s})
AND id = ?'''.format(s={','.join(['?']*len(dates))})
curs.execute(sql,dates + [id])
要形成结果列表,并为缺少的价格插入“无”,您可以从(日期,价格)对中形成一个字典,并使用dict.get()方法
缺少日期键时提供默认值None:
result = dict(curs.fetchall())
result = [(result.get(d,None), d) for d in date]
注意将dict形成为从日期到价格的映射,我在SQL查询中交换了日期和价格的顺序.
时间测试:
我比较了这三个功能:
def using_sqlite_union():
sql = '''
SELECT p.price, t.date
FROM ( {t} ) t
LEFT JOIN price p
ON p.date = t.date
'''.format(t = ' UNION ALL '.join('SELECT {d!r} date'.format(d = str(d))
for d in dates))
cursor.execute(sql)
return cursor.fetchall()
def using_sqlite_dates():
sql = '''
SELECT p.price, t.date
FROM ( SELECT date from dates ) t
LEFT JOIN price p
ON p.date = t.date
'''
cursor.execute(sql)
return cursor.fetchall()
def using_python_dict():
cursor.execute('''
SELECT date, price
FROM price
WHERE date <= ?
AND date >= ?
''', (max(dates), min(dates)))
result = dict(cursor.fetchall())
result = [(result.get(d,None), d) for d in dates]
return result
N = 500
m = 10
omit = random.sample(range(N), m)
dates = [ datetime.date(2000, 1, 1)+datetime.timedelta(days = i) for i in range(N) ]
rows = [ (d, random.random()) for i, d in enumerate(dates) if i not in omit ]
行定义了已插入价格表的数据.
Timeit测试结果:
像这样运行timeit:
python -mtimeit -s'import timeit_sqlite_union as t' 't.using_python_dict()'
产生了这些基准:
·────────────────────·────────────────────·
│ using_python_dict │ 1.47 msec per loop │
│ using_sqlite_dates │ 3.39 msec per loop │
│ using_sqlite_union │ 5.69 msec per loop │
·────────────────────·────────────────────·
using_python_dict比using_sqlite_dates快约2.3倍.即使我们将总日期数增加到10000,速度比仍保持不变:
·────────────────────·────────────────────·
│ using_python_dict │ 32.5 msec per loop │
│ using_sqlite_dates │ 81.5 msec per loop │
·────────────────────·────────────────────·
结论:将所有工作转移到sqlite并不一定更快.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。