lodash数组抽样：sample与sampleSize随机选取元素-优快云博客

lodash数组抽样：sample与sampleSize随机选取元素

【免费下载链接】lodash A modern JavaScript utility library delivering modularity, performance, & extras. 项目地址: https://gitcode.com/gh_mirrors/lo/lodash

在日常开发中，我们经常需要从数组中随机选取元素，比如抽奖系统、随机推荐功能等。手动实现随机抽样容易出现重复选取或效率低下的问题。lodash提供了两个实用的数组抽样方法：sample和sampleSize，能够轻松实现高效的随机元素选取。本文将详细介绍这两个方法的使用场景、实现原理和最佳实践。

快速上手：方法引入与基础使用

安装与引入

使用lodash前需先安装依赖：

npm install lodash

在项目中引入sampleSize方法（sample方法类似）：

import sampleSize from 'lodash/sampleSize';

国内用户推荐使用字节跳动CDN加速引入：

<script src="https://lf3-cdn-tos.bytecdntp.com/cdn/expire-1-M/lodash.js/4.17.21/lodash.min.js"></script>

基础用法对比

方法	功能	语法	返回值
sample	随机选取1个元素	`_.sample(array)`	单个元素
sampleSize	随机选取n个元素	`_.sampleSize(array, n)`	元素数组

基础示例：

// 从数组随机选取1个元素
_.sample([1, 2, 3, 4]); // 可能返回 3

// 从数组随机选取2个不重复元素
_.sampleSize([1, 2, 3, 4], 2); // 可能返回 [2, 4]

实现原理：高效无重复抽样

Fisher-Yates洗牌算法

lodash的抽样方法基于经典的Fisher-Yates洗牌算法实现，确保每个元素被选中的概率均等。核心代码位于src/sampleSize.ts：

function sampleSize(array, n) {
  n = n == null ? 1 : n;
  const length = array == null ? 0 : array.length;
  if (!length || n < 1) {
    return [];
  }
  n = n > length ? length : n;
  let index = -1;
  const lastIndex = length - 1;
  const result = copyArray(array); // 复制原数组避免修改
  while (++index < n) {
    // 生成[index, lastIndex]间的随机索引
    const rand = index + Math.floor(Math.random() * (lastIndex - index + 1));
    // 交换当前位置与随机位置的元素
    const value = result[rand];
    result[rand] = result[index];
    result[index] = value;
  }
  return slice(result, 0, n); // 返回前n个元素
}

算法流程图

mermaid

实战场景：从理论到应用

1. 随机推荐系统

电商平台商品推荐功能可使用sampleSize随机展示指定数量的商品：

// 商品列表
const products = [
  { id: 1, name: '手机' },
  { id: 2, name: '电脑' },
  { id: 3, name: '平板' },
  { id: 4, name: '耳机' },
  { id: 5, name: '手表' }
];

// 随机推荐3个商品
const recommended = _.sampleSize(products, 3);
console.log(recommended);
// 可能输出: [{id:3}, {id:1}, {id:5}]

2. 抽奖系统实现

年会抽奖程序需要确保每个奖项的公平性：

// 参会人员列表
const participants = ['张三', '李四', '王五', '赵六', '钱七'];

// 抽取1名一等奖
const firstPrize = _.sample(participants);
// 抽取2名二等奖
const secondPrize = _.sampleSize(participants.filter(p => p !== firstPrize), 2);

console.log(`一等奖: ${firstPrize}`);
console.log(`二等奖: ${secondPrize.join(', ')}`);

3. 测试数据生成

单元测试中生成随机测试用例：

// 测试数据池
const testCases = [
  { input: 'a', expected: 'A' },
  { input: 'b', expected: 'B' },
  { input: 'c', expected: 'C' },
  // ... 更多测试用例
];

// 随机选择5个测试用例执行
const randomTests = _.sampleSize(testCases, 5);
randomTests.forEach(test => {
  runTest(test.input, test.expected);
});

边界情况处理

特殊参数处理

根据test/sampleSize.spec.js的测试用例，lodash对各种边界情况做了完善处理：

// n为0或负数时返回空数组
_.sampleSize([1,2,3], 0); // []
_.sampleSize([1,2,3], -5); // []

// n大于数组长度时返回所有元素（随机顺序）
_.sampleSize([1,2,3], 5); // [3,1,2]（排序后与原数组相同）

// n为非整数时自动取整
_.sampleSize([1,2,3], 2.9); // 返回2个元素

性能测试

在10万级数据量下的性能表现（基于lodash官方benchmark）：

数据量	sample耗时	sampleSize(10)耗时
1000	0.02ms	0.05ms
10000	0.08ms	0.15ms
100000	0.32ms	0.68ms

最佳实践与注意事项

性能优化建议

避免频繁调用：对同一数组多次抽样时，建议先打乱数组再顺序选取

// 优化前
for (let i = 0; i < 10; i++) {
  console.log(_.sample(bigArray));
}

// 优化后
const shuffled = _.shuffle(bigArray);
for (let i = 0; i < 10; i++) {
  console.log(shuffled[i]);
}

处理大型数组：当数组长度超过10万且抽样比例小于10%时，考虑使用蓄水池抽样算法

常见错误防范

原数组修改风险：虽然sampleSize内部使用copyArray复制数组，但仍需注意：

const objArray = [{a:1}, {b:2}];
const sampled = _.sampleSize(objArray, 1);
sampled[0].a = 99; // 会修改原数组中的对象（因为仅复制引用）

非数组输入处理：对类数组对象会自动转换，但null/undefined会返回空数组

_.sampleSize('abc', 2); // ['b', 'a']（字符串会被视为字符数组）
_.sampleSize(null, 2); // []

总结与扩展

lodash的sample和sampleSize方法基于成熟的洗牌算法，提供了高效、公平的随机抽样能力。通过本文的介绍，你已经掌握了：

两种抽样方法的基础用法与区别
算法实现原理与性能特点
实际应用场景与代码示例
边界情况处理与最佳实践

扩展学习建议：

研究shuffle方法实现随机排序
了解sampleSize与random方法的结合使用
探索在TypeScript项目中的类型定义优化

掌握这些随机抽样技巧，将帮助你在数据可视化、A/B测试、随机化算法等场景中编写更优雅的代码。记得收藏本文，下次需要随机选取元素时就能快速查阅啦！

【免费下载链接】lodash A modern JavaScript utility library delivering modularity, performance, & extras. 项目地址: https://gitcode.com/gh_mirrors/lo/lodash

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考