当我将each_value应用于散列时,它比使用值时要长得多,即使each_value表面上避免分配和复制数组.
我写了一个简单的比较:
require 'benchmark/ips' some_hash = File.open('with_an.dat') { |f| Marshal.load f } Benchmark.ips do |x| x.report "calling each_value" do some_hash.each_value end x.report "calling values" do some_hash.values end x.compare! end Benchmark.ips do |x| x.report "summing each_value" do some_hash.each_value.inject &:+ end x.report "summing values" do some_hash.values.inject &:+ end x.compare! end
以下是结果:
Calculating ------------------------------------- calling each_value 58.166k i/100ms calling values 2.000 i/100ms ------------------------------------------------- calling each_value 1.312M (±40.7%) i/s - 5.468M calling values 29.423 (±10.2%) i/s - 146.000 Comparison: calling each_value: 1312156.6 i/s calling values: 29.4 i/s - 44596.28x slower Calculating ------------------------------------- summing each_value 1.000 i/100ms summing values 1.000 i/100ms ------------------------------------------------- summing each_value 2.107 (± 0.0%) i/s - 11.000 summing values 8.002 (±12.5%) i/s - 40.000 Comparison: summing values: 8.0 i/s summing each_value: 2.1 i/s - 3.80x slower
正如所料,只是调用每个方法,each_value要快得多,因为它只需要创建一个Enumerator,并且实际上不会遍历哈希表.同时,值必须复制整个数组.
解决方法
迭代哈希比迭代数组更慢:
▶ Benchmark.bm do |x| ▷ x.report do ▷ n.times do ▷ {a: 1,b: 2,c: 3,d: 4,e: 5}.inject(1) { |memo,(_,v)| memo * v } ▷ end ▷ end ▷ x.report do ▷ n.times do ▷ [1,2,3,4,5].inject(1) { |memo,v| memo * v } ▷ end ▷ end ▷ end #⇒ user system total real #⇒ 0.700000 0.010000 0.710000 ( 0.712821) #⇒ 0.340000 0.000000 0.340000 ( 0.349040)
通过调用each_value实际上迭代原始Hash实例,同时通过调用values.each迭代正在Array实例上完成(值.)
要回答“为什么会这样”的问题,我们应该看看不同ruby版本的rb_hash_foreach
和rb_array_foreach本机实现.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。