如何解决如何在没有突变的情况下按功能创建高效的分组?
有没有办法高效地实现一个group by function而不用mutation?
简单的实现:
- ReScript playground
- JavaScript(见下文)
var messages = [
{insertedAt: "2021-01-10"},{insertedAt: "2021-01-12"},{insertedAt: "2021-01-13"},{insertedAt: "2021-01-14"},{insertedAt: "2021-01-15"},{insertedAt: "2021-01-16"},{insertedAt: "2021-01-17"},{insertedAt: "2021-01-18"},]
var messagesGroupedByDate = messages.reduce(function (data,message) {
if (
data.some(function (point) {
return point.date === message.insertedAt;
})
) {
return data.map(function (point) {
if (point.date === message.insertedAt) {
return {
date: point.date,count: (point.count + 1) | 0,};
} else {
return point;
}
});
} else {
return data.concat([
{
date: message.insertedAt,count: 1,},]);
}
},[]);
console.log(messagesGroupedByDate);
为了论证起见,没有必要使这更通用。我面临的问题是我循环了三遍:
- 使用
Array.prototype.reduce
一次,这是循环messages
所必需的 - 使用
Array.prototype.some
查看日期键是否已存在于结果数组中 - 在日期键已经存在的情况下,我们再次使用
array.prototype.map
循环以更新数组的特定元素 - 否则,将返回一个包含新元素的新数组
如果在 ReScript 中真的没有什么好的方法可以提高效率,那么我总是可以使用原始 JavaScript 来实现这个功能,但我很好奇是否可以在不发生突变的情况下有效地做到这一点。
解决方法
您可以通过按日期构建计数对象,然后根据需要使用 Object.entries
和 Array.map
将其转换为对象数组来更简单地分组:
var messages = [
{insertedAt: "2021-01-10"},{insertedAt: "2021-01-12"},{insertedAt: "2021-01-13"},{insertedAt: "2021-01-14"},{insertedAt: "2021-01-15"},{insertedAt: "2021-01-16"},{insertedAt: "2021-01-17"},{insertedAt: "2021-01-18"},];
var messagesGroupedByDate = Object.entries(
messages.reduce((data,message) => {
data[message.insertedAt] = data[message.insertedAt] || 0;
data[message.insertedAt]++;
return data;
},{})
).map(([date,count]) => ({ date,count }));
console.log(messagesGroupedByDate);
您也可以直接从 messages
中的值创建一个对象,然后通过循环 messages
来更新计数:
var messages = [
{insertedAt: "2021-01-10"},]
const data = Object.fromEntries(messages.map(({ insertedAt: date }) => [ date,0 ]));
messages.forEach(({ insertedAt: date }) => data[date]++);
const messagesGroupedByDate = Object.entries(data).map(([date,count])=> ({date,count}));
console.log(messagesGroupedByDate);
只需将数据添加到 Map()
,然后转换为数组,然后转换为对象。它不会根据您的要求改变任何内容。
我们可能会进一步简化,但现在是凌晨 5:00,我的大脑现在睡着了。
var messages = [
{insertedAt: "2021-01-10"},];
const mapped = new Map();
messages.forEach(message => {
// if date already seen before,increment the count
if (mapped.has(message.insertedAt)) {
const count = mapped.get(message.insertedAt);
mapped.set(message.insertedAt,count+1);
} else {
// date never seen before,add to map with initial count
mapped.set(message.insertedAt,1);
}
});
const msgArr = Array.from(mapped);
const final = msgArr.map(([date,count}));
console.log(final);
你需要一个地图作为中间数据结构:
{"2021-01-18": 2,/*…*/}
然后将其解构成对并将这些对重新映射为对象:
const count =
xs =>
Object.entries(
xs.reduce((acc,{insertedAt: k}) =>
(acc[k] = (acc[k] ?? 0) + 1,acc),{}))
.map(([k,v]) => ({date: k,count: v}));
// similar to count above but 100% pure
const count_pure =
xs =>
Object.entries(
xs.reduce((acc,{insertedAt: k}) =>
({...acc,[k]: (acc[k] ?? 0) + 1}),count: v}));
console.log(count(messages));
console.log(count_pure(messages));
<script>
var messages = [
{insertedAt: "2021-01-10"},]
</script>
执行此操作时通常使用扩展运算符 …
,但根据您需要处理的项目数量,这可能很快就会变得低效。参见我写的关于主题 https://gist.github.com/customcommander/97eb4b3f1600773db59406d39f3f9cd7
虽然这个问题有点老,但我想我会为未来的读者分享我的代码。下面的代码是用 rescript
编写的并且完全不可变,因为我使用了 Immutable Map
中的 rescript
。
type message = {insertedAt: string}
let messages = [
{insertedAt: "2021-01-10"},]
// Map Values
// Reduce into an immutable map
// Convert to tuple Array
// Log it
messages
->Belt.Array.reduce(Belt.Map.String.empty,(m,v) =>
// Here Every set is creating a new map
m->Belt.Map.String.set(v.insertedAt,m->Belt.Map.String.getWithDefault(v.insertedAt,0) + 1)
)
->Belt.Map.String.toArray
->Js.log
Run In Rescript Playground。在 rescript here 中详细了解不可变 Map。
输出:
[ [ '2021-01-10',1 ],[ '2021-01-12',[ '2021-01-13',3 ],[ '2021-01-14',[ '2021-01-15',2 ],[ '2021-01-16',[ '2021-01-17',[ '2021-01-18',2 ] ]
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。