类 Enumerator::Lazy
Enumerator::Lazy
是一种特殊的 Enumerator
,它允许构建操作链而不立即对其进行评估,并在需要时对值进行评估。为了做到这一点,它重新定义了大多数 Enumerable
方法,以便它们只构建另一个延迟枚举器。
Enumerator::Lazy
可以使用 Enumerable#lazy
方法从任何 Enumerable
构建。
lazy = (1..Float::INFINITY).lazy.select(&:odd?).drop(10).take_while { |i| i < 30 } # => #<Enumerator::Lazy: #<Enumerator::Lazy: #<Enumerator::Lazy: #<Enumerator::Lazy: 1..Infinity>:select>:drop(10)>:take_while>
当调用任何未重新定义的 Enumerable
方法(如 Enumerable#first
或 Enumerable#to_a
)时,将执行真正的枚举(后者别名为 force
,以获得更多语义代码)
lazy.first(2) #=> [21, 23] lazy.force #=> [21, 23, 25, 27, 29]
请注意,大多数 Enumerable
方法可以在 Enumerator::Lazy
上使用或不使用块进行调用,但始终需要一个块
[1, 2, 3].map #=> #<Enumerator: [1, 2, 3]:map> [1, 2, 3].lazy.map # ArgumentError: tried to call lazy map without a block
此类允许对长序列或无限序列进行惯用计算,以及在不构建中间数组的情况下对计算进行链接。
使用缓慢计算序列进行工作的示例
require 'open-uri' # This will fetch all URLs before selecting # necessary data URLS.map { |u| JSON.parse(URI.open(u).read) } .select { |data| data.key?('stats') } .first(5) # This will fetch URLs one-by-one, only till # there is enough data to satisfy the condition URLS.lazy.map { |u| JSON.parse(URI.open(u).read) } .select { |data| data.key?('stats') } .first(5)
使用 “.eager” 结束链会生成一个非延迟枚举器,该枚举器适合返回或传递给期望正常枚举器的另一个方法。
def active_items groups .lazy .flat_map(&:items) .reject(&:disabled) .eager end # This works lazily; if a checked item is found, it stops # iteration and does not look into remaining groups. first_checked = active_items.find(&:checked) # This returns an array of items like a normal enumerator does. all_checked = active_items.select(&:checked)
公共类方法
创建一个新的 Lazy
枚举器。当枚举器实际枚举时(例如通过调用 force
),obj
将被枚举,并且每个值都将传递给给定的块。该块可以使用 yielder
返回值。例如,要创建一个“filter+map”枚举器
def filter_map(sequence) Lazy.new(sequence) do |yielder, *values| result = yield *values yielder << result if result end end filter_map(1..Float::INFINITY) {|i| i*i if i.even?}.first(5) #=> [4, 16, 36, 64, 100]
static VALUE lazy_initialize(int argc, VALUE *argv, VALUE self) { VALUE obj, size = Qnil; VALUE generator; rb_check_arity(argc, 1, 2); if (!rb_block_given_p()) { rb_raise(rb_eArgError, "tried to call lazy new without a block"); } obj = argv[0]; if (argc > 1) { size = argv[1]; } generator = generator_allocate(rb_cGenerator); rb_block_call(generator, id_initialize, 0, 0, lazy_init_block_i, obj); enumerator_init(self, generator, sym_each, 0, 0, 0, size, 0); rb_ivar_set(self, id_receiver, obj); return self; }
公共实例方法
类似于 Enumerable#map
,但链接操作以进行惰性求值。
(1..Float::INFINITY).lazy.map {|i| i**2 } #=> #<Enumerator::Lazy: #<Enumerator::Lazy: 1..Infinity>:map> (1..Float::INFINITY).lazy.map {|i| i**2 }.first(3) #=> [1, 4, 9]
返回一个新的惰性枚举器,其中包含对惰性枚举器中每个元素运行一次 block
的连接结果。
["foo", "bar"].lazy.flat_map {|i| i.each_char.lazy}.force #=> ["f", "o", "o", "b", "a", "r"]
如果满足以下任一条件,则 block
返回的值 x
将被分解
-
x
同时响应 each 和 force,这意味着x
是一个惰性枚举器。 -
x
是一个数组或响应 to_ary。
否则,x
将按原样包含在返回值中。
[{a:1}, {b:2}].lazy.flat_map {|i| i}.force #=> [{:a=>1}, {:b=>2}]
类似于 Enumerable#chunk
,但链接操作以进行惰性求值。
endif static VALUE lazy_super(int argc, VALUE *argv, VALUE lazy) { return enumerable_lazy(rb_call_super(argc, argv)); }
类似于 Enumerable#map
,但链接操作以进行惰性求值。
(1..Float::INFINITY).lazy.map {|i| i**2 } #=> #<Enumerator::Lazy: #<Enumerator::Lazy: 1..Infinity>:map> (1..Float::INFINITY).lazy.map {|i| i**2 }.first(3) #=> [1, 4, 9]
返回一个新的惰性枚举器,其中包含对惰性枚举器中每个元素运行一次 block
的连接结果。
["foo", "bar"].lazy.flat_map {|i| i.each_char.lazy}.force #=> ["f", "o", "o", "b", "a", "r"]
如果满足以下任一条件,则 block
返回的值 x
将被分解
-
x
同时响应 each 和 force,这意味着x
是一个惰性枚举器。 -
x
是一个数组或响应 to_ary。
否则,x
将按原样包含在返回值中。
[{a:1}, {b:2}].lazy.flat_map {|i| i}.force #=> [{:a=>1}, {:b=>2}]
与 Enumerable#compact
类似,但对操作进行链式处理以延迟求值。
static VALUE lazy_compact(VALUE obj) { return lazy_add_method(obj, 0, 0, Qnil, Qnil, &lazy_compact_funcs); }
与 Enumerable#drop
类似,但对操作进行链式处理以延迟求值。
static VALUE lazy_drop(VALUE obj, VALUE n) { long len = NUM2LONG(n); VALUE argv[2]; argv[0] = sym_each; argv[1] = n; if (len < 0) { rb_raise(rb_eArgError, "attempt to drop negative size"); } return lazy_add_method(obj, 2, argv, n, rb_ary_new3(1, n), &lazy_drop_funcs); }
与 Enumerable#drop_while
类似,但对操作进行链式处理以延迟求值。
static VALUE lazy_drop_while(VALUE obj) { if (!rb_block_given_p()) { rb_raise(rb_eArgError, "tried to call lazy drop_while without a block"); } return lazy_add_method(obj, 0, 0, Qfalse, Qnil, &lazy_drop_while_funcs); }
返回从延迟枚举器转换的非延迟 Enumerator
。
static VALUE lazy_eager(VALUE self) { return enumerator_init(enumerator_allocate(rb_cEnumerator), self, sym_each, 0, 0, lazy_eager_size, Qnil, 0); }
类似于 Object#to_enum
,但它返回一个延迟枚举器。这使得定义 Enumerable
方法变得简单,如果从延迟枚举器调用这些方法,它们将自然地保持延迟。
例如,从 Object#to_enum
中的示例继续
# See Object#to_enum for the definition of repeat r = 1..Float::INFINITY r.repeat(2).first(5) # => [1, 1, 2, 2, 3] r.repeat(2).class # => Enumerator r.repeat(2).map{|n| n ** 2}.first(5) # => endless loop! # works naturally on lazy enumerator: r.lazy.repeat(2).class # => Enumerator::Lazy r.lazy.repeat(2).map{|n| n ** 2}.first(5) # => [1, 1, 4, 4, 9]
类似于 Enumerable#select
,但链接操作以进行惰性求值。
与 Enumerable#filter_map
类似,但对操作进行链式处理以延迟求值。
(1..).lazy.filter_map { |i| i * 2 if i.even? }.first(5) #=> [4, 8, 12, 16, 20]
static VALUE lazy_filter_map(VALUE obj) { if (!rb_block_given_p()) { rb_raise(rb_eArgError, "tried to call lazy filter_map without a block"); } return lazy_add_method(obj, 0, 0, Qnil, Qnil, &lazy_filter_map_funcs); }
类似于 Enumerable#select
,但链接操作以进行惰性求值。
返回一个新的惰性枚举器,其中包含对惰性枚举器中每个元素运行一次 block
的连接结果。
["foo", "bar"].lazy.flat_map {|i| i.each_char.lazy}.force #=> ["f", "o", "o", "b", "a", "r"]
如果满足以下任一条件,则 block
返回的值 x
将被分解
-
x
同时响应 each 和 force,这意味着x
是一个惰性枚举器。 -
x
是一个数组或响应 to_ary。
否则,x
将按原样包含在返回值中。
[{a:1}, {b:2}].lazy.flat_map {|i| i}.force #=> [{:a=>1}, {:b=>2}]
static VALUE lazy_flat_map(VALUE obj) { if (!rb_block_given_p()) { rb_raise(rb_eArgError, "tried to call lazy flat_map without a block"); } return lazy_add_method(obj, 0, 0, Qnil, Qnil, &lazy_flat_map_funcs); }
与Enumerable#grep
类似,但将操作链接起来以进行延迟评估。
static VALUE lazy_grep(VALUE obj, VALUE pattern) { const lazyenum_funcs *const funcs = rb_block_given_p() ? &lazy_grep_iter_funcs : &lazy_grep_funcs; return lazy_add_method(obj, 0, 0, pattern, rb_ary_new3(1, pattern), funcs); }
与Enumerable#grep_v
类似,但将操作链接起来以进行延迟评估。
static VALUE lazy_grep_v(VALUE obj, VALUE pattern) { const lazyenum_funcs *const funcs = rb_block_given_p() ? &lazy_grep_v_iter_funcs : &lazy_grep_v_funcs; return lazy_add_method(obj, 0, 0, pattern, rb_ary_new3(1, pattern), funcs); }
返回自身。
static VALUE lazy_lazy(VALUE obj) { return obj; }
类似于 Enumerable#map
,但链接操作以进行惰性求值。
(1..Float::INFINITY).lazy.map {|i| i**2 } #=> #<Enumerator::Lazy: #<Enumerator::Lazy: 1..Infinity>:map> (1..Float::INFINITY).lazy.map {|i| i**2 }.first(3) #=> [1, 4, 9]
static VALUE lazy_map(VALUE obj) { if (!rb_block_given_p()) { rb_raise(rb_eArgError, "tried to call lazy map without a block"); } return lazy_add_method(obj, 0, 0, Qnil, Qnil, &lazy_map_funcs); }
与Enumerable#reject
类似,但将操作链接起来以进行延迟评估。
static VALUE lazy_reject(VALUE obj) { if (!rb_block_given_p()) { rb_raise(rb_eArgError, "tried to call lazy reject without a block"); } return lazy_add_method(obj, 0, 0, Qnil, Qnil, &lazy_reject_funcs); }
类似于 Enumerable#select
,但链接操作以进行惰性求值。
static VALUE lazy_select(VALUE obj) { if (!rb_block_given_p()) { rb_raise(rb_eArgError, "tried to call lazy select without a block"); } return lazy_add_method(obj, 0, 0, Qnil, Qnil, &lazy_select_funcs); }
与Enumerable#take
类似,但将操作链接起来以进行延迟评估。
static VALUE lazy_take(VALUE obj, VALUE n) { long len = NUM2LONG(n); if (len < 0) { rb_raise(rb_eArgError, "attempt to take negative size"); } n = LONG2NUM(len); /* no more conversion */ return lazy_add_method(obj, 0, 0, n, rb_ary_new3(1, n), &lazy_take_funcs); }
与 Enumerable#take_while
类似,但链接操作以延迟评估。
static VALUE lazy_take_while(VALUE obj) { if (!rb_block_given_p()) { rb_raise(rb_eArgError, "tried to call lazy take_while without a block"); } return lazy_add_method(obj, 0, 0, Qnil, Qnil, &lazy_take_while_funcs); }
将lazy
枚举器扩展为数组。请参见Enumerable#to_a
。
static VALUE lazy_to_a(VALUE self) { }
类似于 Object#to_enum
,但它返回一个延迟枚举器。这使得定义 Enumerable
方法变得简单,如果从延迟枚举器调用这些方法,它们将自然地保持延迟。
例如,从 Object#to_enum
中的示例继续
# See Object#to_enum for the definition of repeat r = 1..Float::INFINITY r.repeat(2).first(5) # => [1, 1, 2, 2, 3] r.repeat(2).class # => Enumerator r.repeat(2).map{|n| n ** 2}.first(5) # => endless loop! # works naturally on lazy enumerator: r.lazy.repeat(2).class # => Enumerator::Lazy r.lazy.repeat(2).map{|n| n ** 2}.first(5) # => [1, 1, 4, 4, 9]
static VALUE lazy_to_enum(int argc, VALUE *argv, VALUE self) { VALUE lazy, meth = sym_each, super_meth; if (argc > 0) { --argc; meth = *argv++; } if (RTEST((super_meth = rb_hash_aref(lazy_use_super_method, meth)))) { meth = super_meth; } lazy = lazy_to_enum_i(self, meth, argc, argv, 0, rb_keyword_given_p()); if (rb_block_given_p()) { RB_OBJ_WRITE(lazy, &enumerator_ptr(lazy)->size, rb_block_proc()); } return lazy; }
与 Enumerable#uniq
类似,但链接操作以延迟评估。
static VALUE lazy_uniq(VALUE obj) { const lazyenum_funcs *const funcs = rb_block_given_p() ? &lazy_uniq_iter_funcs : &lazy_uniq_funcs; return lazy_add_method(obj, 0, 0, Qnil, Qnil, funcs); }
如果给定一个块,则返回一个惰性枚举器,它将使用索引(从 offset
开始)为每个元素迭代给定的块,并返回一个惰性枚举器,该枚举器产生相同的值(不带索引)。
如果未给定块,则返回一个新的惰性枚举器,其中包含从 offset
开始的索引。
offset
-
要使用的起始索引
static VALUE lazy_with_index(int argc, VALUE *argv, VALUE obj) { VALUE memo; rb_scan_args(argc, argv, "01", &memo); if (NIL_P(memo)) memo = LONG2NUM(0); return lazy_add_method(obj, 0, 0, memo, rb_ary_new_from_values(1, &memo), &lazy_with_index_funcs); }
与 Enumerable#zip
类似,但链接操作以延迟评估。但是,如果将块提供给 zip,则立即枚举值。
static VALUE lazy_zip(int argc, VALUE *argv, VALUE obj) { VALUE ary, v; long i; const lazyenum_funcs *funcs = &lazy_zip_funcs[1]; if (rb_block_given_p()) { return rb_call_super(argc, argv); } ary = rb_ary_new2(argc); for (i = 0; i < argc; i++) { v = rb_check_array_type(argv[i]); if (NIL_P(v)) { for (; i < argc; i++) { if (!rb_respond_to(argv[i], id_each)) { rb_raise(rb_eTypeError, "wrong argument type %"PRIsVALUE" (must respond to :each)", rb_obj_class(argv[i])); } } ary = rb_ary_new4(argc, argv); funcs = &lazy_zip_funcs[0]; break; } rb_ary_push(ary, v); } return lazy_add_method(obj, 0, 0, ary, ary, funcs); }
私有实例方法
对每个元素及其索引(从 offset
开始)迭代给定的块。如果没有给出块,则返回一个新的 Enumerator
,其中包括从 offset
开始的索引
offset
-
要使用的起始索引
static VALUE enumerator_with_index(int argc, VALUE *argv, VALUE obj) { VALUE memo; rb_check_arity(argc, 0, 1); RETURN_SIZED_ENUMERATOR(obj, argc, argv, enumerator_enum_size); memo = (!argc || NIL_P(memo = argv[0])) ? INT2FIX(0) : rb_to_int(memo); return enumerator_block_call(obj, enumerator_with_index_i, (VALUE)MEMO_NEW(memo, 0, 0)); }