使用 Python 和 Gretel.ai 生成合成位置数据
作者:Alex Watson,联合创始人兼首席产品官,Gretel.ai,Gretel.ai
标题照片由 sylv1rob1 通过 ShutterStock* 提供
Gretel.ai 如何使用 Python 训练 FastCUT GAN,为世界上任何城市生成真实的合成位置数据。
介绍
在 Gretel.ai,我们的使命是让开发人员和数据科学家能够快速轻松地创建生产级合成数据。为了实现这一目标,我们设计了一系列 API,使任何人都能在几分钟内上手,以便他们能够识别、转换并生成现代软件应用程序和 AI/ML 模型测试所需的数据。Python 是驱动 Gretel 的研究、开发和部署我们 API 和工具包的引擎。从用户体验的角度来看,Python 的广泛库和框架(例如,用于机器学习的 Scikit-learn 和 TensorFlow,用于文本处理的 Spacy,以及用于数据探索的 Numpy)、其处理复杂数据结构的能力,以及其开箱即用的集成功能,帮助我们确保 Gretel 的平台易于使用,并且可以轻松扩展到任何工作流程或项目。
在本文中,我们强调了在 Python 的支持下,我们如何创建了一个 GAN 位置生成器,可以使用地图图像和地理位置数据来创建新的合成训练数据,帮助模型预测人类(或本例中的电动自行车)可能在世界上任何位置的高统计精度。通过结合和情境化不同类型的数据来做出更好预测的概念验证在各个行业中都有应用——例如改善医疗诊断和金融市场预测,甚至在元宇宙中构建真实的模拟。
如果你想自己尝试这个实验,所有的工具、代码和数据都是开源的,可以在 GitHub 上找到。
过程概述
为用户测试或