当前位置: 首页 > news >正文

SSAS - 生成模拟测试数据

在分析系统中,因为数据量太大,无法直观看出统计结果的正确性。在使用新技术时,需要使用简单的数据,来验证语句的结果。本文介绍SQL Server生成模拟数据的方法。

使用技术

一、静态数据:VALUES

  1. 使用说明
  • 格式:VALUES (列1值, 列2值, 列3值), (列1值2, 列2值2, 列3值2)…
  • 命名:AS 表名(列1名, 列2名, 列3名),列的数量和顺序必须和 VALUES 里的一致
  • 类型:SQL Server 会自动推断列的数据类型(如数字、字符串、小数),也可手动指定(如 CAST(‘产品A’ AS VARCHAR(20)))。
  1. 示例
SELECT*FROM(VALUES(1,'张三','销售部',8000.00),(2,'李四','技术部',9500.50),(3,'王五','财务部',7800.80))ASEmployees(Id,Name,Department,Salary);
  1. 结果
IdNameDepartmentSalary
1张三销售部8000.00
2李四技术部9500.50
3王五财务部7800.80

二、序列数据:master.dbo.spt_values

  1. 使用说明
    利用 spt_values 生成时间序列:master.dbo.spt_values 中 type = ‘P’ 的记录包含连续的数字(0-2047),可以用它来生成 N 个月份的序列(对应 2024-2025 年)。

  2. 示例

SELECTnumberASId,DATEADD(MONTH,number,'2024-01-01')AS[Date]FROMmaster.dbo.spt_valuesWHEREtype='P'ANDnumberBETWEEN0AND23
  1. 结果
IdDate
02024-01-01 00:00:00.000
12024-02-01 00:00:00.000
22024-03-01 00:00:00.000
232025-12-01 00:00:00.000

三、随机数字:ABS(CHECKSUM(NEWID()))

  1. 使用说明
  • ABS(CHECKSUM(NEWID())):核心作用是生成一个随机的 32 位整数(非负数),常用来快速生成无规律的随机数,是 SQL Server 中生成随机整数的经典写法。
  • NEWID():创建一个全球唯一的UNIQUEIDENTIFIER类型值(GUID/UUID),格式如E2B5D86C-7B9F-4A8D-9876-1234567890AB。每次执行都会生成完全不同的值。
  • CHECKSUM():计算哈希值,对输入的任意值计算一个 32 位的整数校验和(哈希值),返回值是INT类型,范围为-21474836482147483647(可能是正数或负数)。
  • ABS():取绝对值
  1. 示例
SELECTABS(CHECKSUM(NEWID())),ABS(CHECKSUM(NEWID())),ABS(CHECKSUM(NEWID()))
  1. 结果
82013466315905810271359169063

实际应用

一、生成2025年目标数据

  1. 语句
SELECTDATEADD(MONTH,sv.number,'2025-01-01')ASDate,p.ProductId,ABS(CHECKSUM(NEWID()))%1000+100ASQuantity,(ABS(CHECKSUM(NEWID()))%1000+100)*10ASTotalFROMmaster.dbo.spt_values svCROSSJOIN(VALUES(101),(102),(103))ASp(ProductId)WHEREsv.type='P'ANDsv.numberBETWEEN0AND11ORDERBYDate,ProductId;
  1. 结果
DateProductIdQuantityTotal
2025-01-01 00:00:00.00010110114210
2025-01-01 00:00:00.0001024098650
2025-01-01 00:00:00.0001036849420
2025-02-01 00:00:00.0001012714340
2025-02-01 00:00:00.0001024116420
2025-02-01 00:00:00.0001032967140
2025-12-01 00:00:00.0001016424680
2025-12-01 00:00:00.00010210033790
2025-12-01 00:00:00.0001031596500
  1. 说明
  • 月份采用日期表示,以与实际完成数据维度对齐
  • 数量通常改为固定值,以方便在测试时判断统计是否正确
  • 用于SSAS命名查询,需去掉order by。
http://www.jsqmd.com/news/274773/

相关文章:

  • 数据分类预测总让人头秃,传统BP神经网络容易掉进局部最优解的大坑。今天咱们搞点刺激的——用遗传算法给BP神经网络调参,直接在MATLAB里整活
  • 基于FPGA的图像形态学腐蚀处理Verilog开发与开发板硬件测试
  • 【技术分享】让AI变“听话“:AI Agent Skill完全指南,收藏备用
  • NFT:从加密猫到数字资产新纪元的全面解析
  • AI智能体的“成长秘诀“:从强化学习到DPO算法,实现从被动执行到自我进化的飞跃【建议收藏】
  • 干货满满:Redis 分布式锁必避的 8 大问题及解决方案
  • 数字钱包:如何正确选择使用你的数字钱包
  • 学习进度 4
  • 买礼物(洛谷P1194)
  • Springboot中使用activemq
  • 公路修建(洛谷P1265)
  • 程序监控与异常防护-PART-Simulink-看门狗
  • 1120
  • LIDA 477 编码器位移/速度/加速度采集与转换-PART-LIDA 477-采集转换
  • 文件IO
  • 1121
  • 软件升级回退报告
  • SQL Server数据库
  • 1124
  • 1125
  • 灵活用工系统开发全流程与案例分享【弹性用工解决方案|附源码】
  • RocksDB 可直接运行的实战示例(多语言 + 完整安装 + 基础 CRUD + 事务 + 生产调优)
  • 7月4日
  • VideoDownloadHelper视频下载助手终极指南:全网视频轻松保存
  • 专业陪诊系统:守护银发健康
  • 1126
  • 1013
  • RocksDB 全面指南
  • 7月5日
  • 1128