微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何通知用户正在使用缓存?

如何解决如何通知用户正在使用缓存?

我正在使用 python 库 diskcache 及其装饰器 @cache.memoize 来缓存对我的 couchdb 数据库调用。工作正常。但是,我想向用户打印数据是从数据库返回还是从缓存返回。

我什至不知道如何解决这个问题。

到目前为止我的代码

import couchdb
from diskcache import Cache

cache = Cache("couch_cache")


@cache.memoize()
def fetch_doc(url: str,database: str,doc_id: str) -> dict:

    server = couchdb.Server(url=url)
    db = server[database]

    return dict(db[doc_id])

解决方法

这是一种方法,但我并不真正推荐它,因为 (1) 它增加了一个额外的操作来手动检查缓存,并且 (2) 它可能会重复库内部已经在做的事情。我没有对任何性能影响进行适当的检查,因为我没有带有不同 doc_id 的生产数据/环境,但正如 martineau's comment 所说,它可能变慢由于额外的查找操作而导致事情失败。

但它就是这样。

diskcache.Cache 对象“支持熟悉的 Python 映射接口”(如 dicts)。然后,您可以使用根据 memoize-d 函数的参数自动生成的相同的键,手动检查缓存中是否已经存在给定的键:

额外的 __cache_key__ 属性可用于生成用于给定参数的缓存键。

>>> key = fibonacci.__cache_key__(100)  
>>> print(cache[key])  
>>> 354224848179261915075    

因此,您可以将 fetch_doc 函数包装到 另一个 函数中,该函数检查是否基于 urldatabase 和 {{ 1}} 参数存在,在调用实际的 doc_id 函数之前将结果打印给用户:

fetch_doc

测试时:

import couchdb
from diskcache import Cache

cache = Cache("couch_cache")

@cache.memoize()
def fetch_doc(url: str,database: str,doc_id: str) -> dict:
    server = couchdb.Server(url=url)
    db = server[database]
    return dict(db[doc_id])

def fetch_doc_with_logging(url: str,doc_id: str):
    # Generate the key
    key = fetch_doc.__cache_key__(url,database,doc_id)

    # Print out whether getting from cache or not
    if key in cache:
        print(f'Getting {doc_id} from cache!')
    else:
        print(f'Getting {doc_id} from DB!')

    # Call the actual memoize-d function
    return fetch_doc(url,doc_id)

它输出:

url = 'https://your.couchdb.instance'
database = 'test'
doc_id = 'c97bbe3127fb6b89779c86da7b000885'

cache.stats(enable=True,reset=True)
for _ in range(5):
    fetch_doc_with_logging(url,doc_id)
print(f'(hits,misses) = {cache.stats()}')

# Only for testing,so 1st call will always miss and will get from DB
cache.clear()

你可以把这个包装函数变成一个装饰器:

$ python test.py 
Getting c97bbe3127fb6b89779c86da7b000885 from DB!
Getting c97bbe3127fb6b89779c86da7b000885 from cache!
Getting c97bbe3127fb6b89779c86da7b000885 from cache!
Getting c97bbe3127fb6b89779c86da7b000885 from cache!
Getting c97bbe3127fb6b89779c86da7b000885 from cache!
(hits,misses) = (4,1)

as suggested in the comments,将其组合成 1 个新的装饰器:

def log_if_cache_or_not(memoized_func):
    def _wrap(*args):
        key = memoized_func.__cache_key__(*args)
        if key in cache:
            print(f'Getting {doc_id} from cache!')
        else:
            print(f'Getting {doc_id} from DB!')
        return memoized_func(*args)

    return _wrap

@log_if_cache_or_not
@cache.memoize()
def fetch_doc(url: str,doc_id: str) -> dict:
    server = couchdb.Server(url=url)
    db = server[database]
    return dict(db[doc_id])

for _ in range(5):
    fetch_doc(url,doc_id)

一些快速测试:

def memoize_with_logging(func):
    memoized_func = cache.memoize()(func)

    def _wrap(*args):
        key = memoized_func.__cache_key__(*args)
        if key in cache:
            print(f'Getting {doc_id} from cache!')
        else:
            print(f'Getting {doc_id} from DB!')
        return memoized_func(*args)

    return _wrap

@memoize_with_logging
def fetch_doc(url: str,doc_id)

(如果 In [9]: %timeit for _ in range(100000): fetch_doc(url,doc_id) 13.7 s ± 112 ms per loop (mean ± std. dev. of 7 runs,1 loop each) In [10]: %timeit for _ in range(100000): fetch_doc_with_logging(url,doc_id) 21.2 s ± 637 ms per loop (mean ± std. dev. of 7 runs,1 loop each) 在调用中随机变化可能会更好)

同样,正如我在开始时提到的,缓存和 doc_id 函数调用应该可以加速该函数。无论您是从数据库还是从缓存中获取,此答案都会添加缓存查找和打印/记录的附加操作,并且它可能影响该函数调用的性能。适当测试。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。