当前位置: 首页 > news >正文

经管科研数据使用指南:一站式数据资源推荐清单

经管科研数据使用指南:一站式数据资源推荐清单

写在前面:本文整理了经管领域常用的科研数据资源,涵盖上市公司、地级市、省级、县域等多个层面,以及微观调查、文本分析等多种数据类型。无论你是研究企业创新、ESG表现,还是区域经济发展,都能在这里找到适用的数据推荐。建议收藏备用!

目录导航​​​​​​

一、上市公司数据资源

上市公司数据是经管实证研究的核心素材,主要来源包括CSMAR、Wind等数据库,以及学者们整理的特色数据集。

1.1 财务与治理基础数据

数据类型主要变量适用场景
上市公司数据大全1372个变量,覆盖财务报表、公司治理、股票交易等各类企业研究的基础面板
常用控制变量企业规模、资产负债率、盈利能力、成立年限等回归分析的标配控制变量集
内部控制指数内部控制质量评分、缺陷数量等公司治理、风险管理研究
盈余管理数据应计盈余管理、真实盈余管理指标财务报告质量研究
审计费用审计费用金额、审计意见类型审计市场、代理成本研究
审计时滞审计报告披露时间信息披露及时性研究
财务舞弊数据舞弊案例标记、造假类型等财务违规、审计失败研究

1.2 创新与专利数据

数据类型主要变量适用场景
专利明细数据专利申请量、授权量、专利类型(发明/实用新型/外观设计)企业创新能力基础指标
绿色专利绿色创新专利数量、IPC分类环境创新、ESG研究
数字经济专利人工智能、云计算、区块链等数字技术专利数字化转型、企业创新
专利引用数据施引/被引次数、引用网络知识溢出、创新质量评估

1.3 ESG与可持续发展数据

数据类型主要变量适用场景
华证ESG评级ESG综合评分、环境(E)、社会(S)、治理(G)分项评分ESG投资、企业社会责任研究
环境信息披露环境信息披露质量评分、环保投入环境信息透明度研究
绿色投资绿色投资支出、节能环保支出绿色转型、财务绩效研究
碳排放数据碳排放量、碳强度碳减排、气候变化研究
污染物排放SO2、废水、固废排放量环境规制效果研究

1.4 数字化转型数据

数字化转型是近年研究热点,学者们提供了多个版本的测算数据:

数据版本主要变量特点
吴非版数字化转型关键词词频统计应用最广泛,跨期长
袁淳版数字化转型综合指标覆盖面广
张永坤版多维度数字化转型指标指标体系完善
年报文本数据MD&A中数字化相关词汇频率可自行补充测算

1.5 公司治理与高管数据

数据类型主要变量适用场景
董监高特征性别、年龄、学历、专业背景、任期高管团队异质性研究
政治关联高管政府背景、政治身份政治关联与企业行为研究
高管薪酬薪酬总额、薪酬差距、股权激励薪酬激励、代理问题
高管团队稳定性团队成员变动频率、任期波动高管更替研究
断裂带数据团队断裂带指标团队异质性与决策质量

1.6 供应链数据

数据类型主要变量适用场景
供应商客户明细前五大供应商/客户占比、关系稳定性供应链依赖、议价能力
供应链韧性供应链多元化、风险暴露程度供应链安全研究
供应链金融供应链融资规模、应付账款周转融资约束、供应链金融

1.7 投资者与市场数据

数据类型主要变量适用场景
投资者情绪情绪指数、资金流向市场预期、资产定价
机构投资者持股机构持股比例、持股结构投资者保护、公司治理
分析师关注度分析师跟踪人数、预测分歧度信息环境、盈余管理

1.8 风险相关数据

数据类型主要变量适用场景
股价崩盘风险负收益偏态系数、收益上下波动比率股价崩盘风险研究
违约风险KMV模型违约概率、信用利差信用风险研究
经营风险经营现金流波动、盈利波动性企业风险承担研究

二、地级市面板数据

地级市层面数据是研究区域经济、城市发展、产业政策的重要支撑。

2.1 经济发展数据

数据类型主要变量适用场景
城市统计年鉴面板GDP、人口、固定资产投资、社会消费品零售城市经济增长研究
GDP与增速人均GDP、GDP增长率区域经济发展评估
财政收入与支出一般预算收入、支出、收支缺口财政健康、转移支付研究
进出口数据进出口总额、外资利用对外开放、外商投资研究

2.2 数字经济发展数据

数据类型主要变量适用场景
数字经济指数数字经济综合发展水平数字经济发展评估
数字基础设施互联网普及率、移动电话普及率数字基础设施研究
数字政府建设指数政务服务数字化水平数字政府、政策效果研究

2.3 环境与绿色发展数据

数据类型主要变量适用场景
环境规制强度污染治理投资、排污费征收环境政策效果研究
PM2.5数据年均PM2.5浓度、空气质量指数环境污染、健康经济研究
碳排放数据碳排放总量、碳排放强度低碳城市、碳减排政策
绿色金融指数绿色信贷、绿色债券发展水平绿色金融政策研究

2.4 社会发展数据

数据类型主要变量适用场景
人口流动数据流动人口规模、人口净流入人口迁移、城镇化研究
城镇化率城镇人口比重、常住人口城镇化率城镇化进程评估
城乡居民收入城镇居民可支配收入、农民纯收入、城乡收入差距收入分配、共同富裕研究

2.5 政策DID数据

准自然实验是因果识别的利器,地级市层面的政策试点数据包括:

政策类型处理组设定适用研究
高铁开通高铁开通城市/年份交通基础设施的经济效应
低碳城市低碳城市试点环境政策效果
自贸区自贸区设立城市贸易便利化政策评估
创新政策创新城市、高新区等创新政策效果评估

三、省级面板数据

省级数据适用于宏观政策研究和区域比较分析。

3.1 市场化指数

数据类型主要变量适用场景
樊纲指数市场化总指数及五大分项指数(政府与市场关系、非国有经济发展、产品市场发展、要素市场发展、市场中介组织和法律制度环境)制度环境、市场化进程研究
市场化总指数综合市场化水平跨省制度比较研究

3.2 产业结构数据

数据类型主要变量适用场景
产业结构合理化产业结构合理化指数产业结构调整效果
产业结构高级化产业结构高级化指数产业结构升级研究

3.3 经济政策数据

数据类型主要变量适用场景
经济政策不确定性(EPU)Baker et al.编制的EPU指数政策不确定性对企业行为影响
贸易政策不确定性(TPU)贸易政策不确定性指数贸易摩擦、关税政策研究

3.4 创新与生产率数据

数据类型主要变量适用场景
专利数据省域专利申请/授权量区域创新能力比较
R&D投入R&D经费支出、研发人员数创新投入研究
全要素生产率(TFP)TFP及其分解经济增长质量研究

四、县域及农村数据

县域数据适用于县域经济、农业农村现代化等研究主题。

数据类型主要变量适用场景
县域统计年鉴面板县域GDP、人口、农业产值、财政收支县域经济发展研究
农村相关数据农村居民收入、农业现代化指标乡村振兴、农业现代化

五、微观调查数据库

微观调查数据是研究个体和家庭行为的重要数据源,四大数据库各有侧重:

数据库全称调查内容适用研究
CFPS中国家庭追踪调查家庭经济、健康、社会参与家庭经济决策、社会流动
CGSS中国综合社会调查社会态度、价值观、社会结构社会分层、社会资本
CHFS中国家庭金融调查家庭金融资产、负债、保险配置家庭金融、财富管理
CLDS中国劳动力动态调查劳动力就业、工作流动、健康劳动力市场、人口质量

使用提示:微观调查数据通常需要申请获取,建议提前了解各数据库的抽样设计,选取适合研究需要的样本。

六、文本数据资源

文本数据为非结构化数据分析提供了丰富的素材。

数据来源数据内容主要应用
人民日报1946年至今的报纸全文政策导向、舆论环境研究
光明日报重要历史时期的报纸全文文化政策、意识形态研究
财经新闻财经媒体报道文本投资者情绪、媒体效应研究
政府工作报告各省市县历年政府工作报告政策重点、文本分析
年报MD&A文本上市公司年报管理层讨论与分析企业战略、信息披露研究

七、常用研究主题数据推荐

7.1 研究企业数字化转型

数据层级推荐数据核心变量
微观吴非/袁淳/张永坤数字化转型数据数字化转型关键词词频
微观数字经济专利数据数字技术专利数量
微观年报MD&A文本数据可自行提取数字化相关内容
宏观城市数字经济指数地区数字经济发展水平
宏观数字基础设施数据互联网普及率等

7.2 研究企业创新

数据层级推荐数据核心变量
微观专利明细数据专利申请/授权数量
微观专利引用数据专利质量、影响力
微观研发投入数据R&D支出、研发强度
微观高管特征数据CEO/董事长创新背景
宏观省级创新指数地区创新氛围

7.3 研究ESG与绿色发展

数据层级推荐数据核心变量
微观华证ESG评级ESG综合及分项评分
微观环境信息披露数据环境信息披露质量
微观绿色专利数据绿色创新产出
微观碳排放/污染物数据企业碳排放量
宏观PM2.5数据地区空气污染程度
宏观环境规制强度地区环境政策力度
宏观绿色金融指数地区绿色金融发展

7.4 研究企业风险

数据层级推荐数据核心变量
微观股价崩盘风险负收益偏态系数(NCSKEW)
微观违约风险KMV违约概率
微观经营风险盈利波动性、现金流波动
微观审计相关审计意见类型、审计费用

7.5 研究公司治理

数据层级推荐数据核心变量
微观内部控制指数内控质量评分
微观董监高特征年龄、学历、任期等
微观高管薪酬薪酬水平、薪酬差距
微观股权结构股权集中度、机构持股
宏观市场化指数地区制度环境

7.6 研究供应链与企业关系

数据层级推荐数据核心变量
微观供应商客户明细前五大供应商/客户占比
微观供应链韧性数据供应链多元化程度
微观供应链金融数据应付账款周转天数

7.7 研究投资者行为与市场

数据层级推荐数据核心变量
微观投资者情绪指数市场情绪度量
微观机构投资者持股机构持股比例、类型
微观分析师关注度分析师跟踪人数
宏观经济政策不确定性EPU指数

7.8 研究区域经济

数据层级推荐数据核心变量
地级市城市面板数据GDP、人口、投资
地级市城镇化率城镇化发展水平
地级市人口流动数据人口净流入/流出
省级樊纲市场化指数市场化制度环境
省级产业结构指数产业结构合理化/高级化

7.9 研究政策效果(DID设计)

政策类型推荐数据处理组设置
交通基础设施高铁开通数据高铁开通城市
环境政策低碳城市试点低碳城市
贸易政策自贸区设立自贸区城市
产业政策高新区/经开区开发区城市
金融政策绿色金融改革创新试验区试点城市

7.10 研究家庭与个体行为

数据库推荐数据适用研究
CFPS家庭追踪调查家庭金融决策、社会流动
CGSS综合社会调查社会态度、社会分层
CHFS家庭金融调查家庭资产配置、财富不平等
CLDS劳动力调查就业流动、人力资本

数据获取与使用建议

常用数据库推荐

  1. CSMAR(国泰安):最全面的中国上市公司数据库
  2. Wind:金融数据终端,含宏观、行业数据
  3. CNRDS(中国研究数据服务平台):学术友好的微观数据
  4. 锐思数据库:股票、债券、基金数据
  5. 中国工业企业数据库:工业企业层面数据
  6. 海关数据库:进出口微观数据
  7. 国家统计局: 宏观数据官方来源

数据使用注意事项

  1. 变量匹配:不同数据库的股票代码、公司名称可能有差异,需做好数据清洗和匹配
  2. 缺失值处理:注意数据的缺失模式和原因,区分"真缺失"与"数据不可得"
  3. 样本选择:明确研究样本的纳入标准(如是否包含金融业、ST公司等)
  4. 极端值处理:连续变量建议进行winsorize处理
  5. 面板平衡性:检查面板数据的平衡性,避免非平衡面板带来的估计偏误
  6. 数据更新:部分数据存在滞后发布,注意使用最新版本

稳健性检验建议

  • 更换核心解释变量的衡量方式(如用授权专利替代申请专利)
  • 改变样本范围(如剔除特殊行业、特殊年份)
  • 更换控制变量集
  • 使用不同的模型设定

结语

数据是实证研究的基石,选择合适的数据对于研究的成功至关重要。本文尽可能全面地整理了经管领域常用的科研数据资源,希望能为各位研究者提供参考。

实际研究中,建议:

  • 明确研究问题:先确定研究主题和假设,再选择对应的数据
  • 多源验证:重要变量可尝试多个数据来源交叉验证
  • 关注数据质量:在使用前仔细检查数据的完整性和准确性

如有任何数据使用方面的问题,欢迎在交流讨论!

http://www.jsqmd.com/news/693308/

相关文章:

  • UniAppX应用上架前必看:关于OAID、IMEI等设备标识的隐私合规实战指南
  • 御万家瓷砖质量怎么样?佛山一线品牌精工品质实测解析 - GrowthUME
  • 融聚农垦 数启新程——宁夏农垦酒农文旅融合数字化新征程 - 华Sir1
  • 终极指南:如何用WinDirStat快速释放Windows磁盘空间
  • 从编码原理到实战:彻底搞懂QT中文乱码,让你的应用告别“火星文”(UTF-8/GBK转换详解)
  • 从零部署:基于中心胖AP(AD9430DN)与远端单元RU(R240D)的无线组网实战
  • 零代码体验bert-base-chinese:内置演示脚本一键运行教程
  • 别再只改DTS了!深入RK3568红外遥控驱动:从PWM捕获中断到Android KeyEvent的完整链路剖析
  • 别再死记硬背Fama-French模型了!用Python实战拆解A股三因子(附代码与数据)
  • 2026年类似OpenClaw但无安全风险的软件推荐,同功能无风险AI自动化智能体盘点 - 品牌2026
  • 告别硬件损耗!用Proteus 8.9给你的Arduino项目做一次‘虚拟体检’
  • 大厂校招面经-携程后端开发
  • 2026年免费行情软件App网站横评:8款实测,散户用哪个最省心?
  • 从市场调研到用户画像:因子分析如何帮你发现隐藏的‘消费者因子’?
  • 别浪费闲置的苏果卡,解读闲置卡券变现秘诀 - 淘淘收小程序
  • 从Blender转FreeCAD:给创意设计师的机械建模入门指南(工作台详解)
  • 【从零开始学Java | 第四十三篇】线程池(Thread Pool)
  • 批量给文件改名的方法有哪些?这5个实用技巧新手也能秒会
  • 从QT5到QT6:qmake构建QML项目的资源管理机制变迁
  • Linux服务器被疯狂访问?别慌,用iftop和tcpdump快速定位异常流量(附完整排查流程)
  • 别再只跑Demo了!手把手教你用DINOv2的Patch特征做简单的图像前景分割
  • 2026年扬州二甲基硅油选购避坑指南:脱模剂、消泡剂、润滑剂全应用对标评测 - 年度推荐企业名录
  • 别再手动对齐了!用CREO骨架模型做装配,效率提升不止一倍(附四连杆机构实战)
  • 安徽旭安商贸:专业的合肥砖块出售服务商 - LYL仔仔
  • 保姆级教程:在Gazebo 11中为WAM-V无人艇模型添加AprilTag(Ubuntu 20.04环境)
  • 5分钟上手XUnity Auto Translator:为Unity游戏实现实时自动翻译的完整指南
  • 2026年生产日期喷码机选购指南:品质与服务并重的选择 - GrowthUME
  • 如何用lunar-javascript快速搞定农历计算?终极完整指南
  • AI自动化处理Google Sheets数据:Composio与Gemini TTS实战
  • 告别杂乱视图!用pcl_viewer的-multiview和-ax参数高效对比多组点云数据