当前位置: 首页 > news >正文

1988-2025年上市公司知识多元化数据

本数据集基于中国创业板上市公司专利数据,采用信息熵方法构建企业层面的知识多元化指数。数据涵盖1988—2025年期间,使用了1048575条公司-专利观测值。数据集核心指标包括:股票代码,申请年份,公司简称,知识多元化指数(TD)。知识多元化指数基于专利IPC主分类号,采用Teachman熵指数法测度,原始计算公式为

其中 pj 为属于主分类 j 的专利数占企业当年专利总数的比例。由于该原始公式恒为非正值(TDraw≤0),为符合信息熵的非负性习惯并便于实际应用,本数据集将TD定义为原始值的绝对值,即

其数值范围在0,ln⁡n之间,值越大表示企业知识基础越广泛、技术布局越多元。

基于本数据集,研究者可从以下三方面展开系统分析:一是风险投资与知识多元化的交互效应研究,将知识多元化指数与CVC、IVC等风险投资变量匹配,检验知识多元化在不同类型风险投资与企业韧性之间的调节作用,揭示“耐心资本”如何通过知识基础影响企业应对不确定性的能力;二是知识多元化对双元创新的差异化影响,利用知识多元化指数与探索式创新、利用式创新指标进行交互分析,考察知识宽度对CVC和IVC创新促进效应的调节方向与强度,验证“知识多元化是一把双刃剑”的理论假设;三是知识多元化与企业绩效的关联研究,结合全要素生产率、销售收入增长率等韧性指标,分析知识多元化对企业抗风险能力与成长韧性的直接效应及间接机制,并探究地区、产权性质、环境不确定性等情境因素的异质性影响,为创业企业技术战略选择提供实证支撑。

本数据集的核心指标“知识多元化指数(TD)”严格遵循李玉花等(2024)及田丹等(2025)的测度方法,采用基于IPC主分类的Teachman熵指数法构建。首先,从智慧芽全球专利检索数据库获取创业板上市公司的专利数据,提取每条专利的IPC主分类号、申请年份,并清洗异常值与缺失值。随后,利用Python编写程序,按股票代码和申请年份分组,统计每个IPC主分类下的专利数量(Pj)以及该企业当年的专利总数(P),计算占比 pj=Pj/P。最后,根据熵指数公式 TD=−∑pjln⁡pj 计算知识多元化指数,并将结果输出为Excel格式的数据表。

数据信息

  • 数据来源:上市公司年度报告
  • 时间跨度:1998-2025
  • 数据范围:上市公司
  • 数据格式:excel形式
  • 数据字段:
股票代码申请年份公司名称公司简称TD

数据展示

参考文献

[1] 李玉花, 李丹丹, 孙国栋. 企业知识多元化、技术溢出与创新绩效——基于中国制造业上市公司的实证研究[J]. 管理世界, 2024, 40(2): 112-128.

[2] 田丹, 丁宝, 刘芙蓉. “耐心资本”赋能新创企业韧性:企业风险投资和独立风险投资的差异化作用[J]. 中国工业经济, 2025, (7): 156-173.

[3] Hoang K, Pham L, Ha O K, et al. Firm-level climate change risk exposure and firm efficiency[J]. International Review of Economics & Finance, 2025, 101: 104220.

[4] Tong Z, Tan Z. Artificial intelligence and climate risk: Toward sustainable development within a Double Helix framework[J]. Technological Forecasting & Social Change, 2026, 226: 124592.

下载→

方式一(推荐):主页 *个人* 简介

经管数据集-CSDN博客

方式二:数据下载方式汇总-CSDN博客

http://www.jsqmd.com/news/629169/

相关文章:

  • OpCore Simplify:如何用图形界面10分钟搞定黑苹果EFI配置?
  • Python3.9镜像亲测:比源码安装更简单,Jupyter/SSH全支持
  • 共话2026年插画培训平台,插画培训步骤与品牌推荐 - 工业品网
  • 测量 TLE5012的角度输出数值
  • 2026年OpenClaw怎么搭建?阿里云6分钟新手部署OpenClaw,千问大模型安装流程
  • 如何快速掌握猫抓浏览器扩展:专业用户的终极资源嗅探方案
  • 如何完全激活Cursor Pro:终极免费使用指南与破解工具详解
  • LangGraph实战指南
  • 避开这些坑!Playwright浏览器上下文管理的4种策略全解析
  • IRISMAN如何通过模块化架构解决PS3备份管理的技术挑战?
  • MobaXterm 进阶应用与高效运维场景实战
  • Apache Doris 容器化实战指南:从Docker镜像构建到Kubernetes集群部署
  • 人工智能提示词场景篇:批判性思维学习
  • 思源宋体完整使用指南:7种字重免费开源字体终极解决方案
  • GLM-4.1V-9B-Base快速上手:10分钟完成CSDN GPU平台图文理解POC验证
  • 小白友好:Yi-Coder-1.5B代码生成模型快速入门教程
  • Anthropic年化收入达300亿美元超越OpenAI | AI信息日报 | 2026年4月12日 星期日
  • 从‘Hello World’到恶意软件:用MD5碰撞漏洞,在Ubuntu上模拟一次真实的软件供应链攻击
  • 3小时从文字到视频:TaleStreamAI 重新定义AI小说推文创作自由
  • AI配音、AI作曲零基础快速上手
  • OpCore Simplify:突破黑苹果配置瓶颈的革命性自动化工具
  • 猫抓浏览器扩展终极指南:如何轻松抓取网页视频和音频资源
  • 2026论文写作工具清单|全流程+分学科+免费版
  • 2026届学术党必备的六大降AI率网站实际效果
  • 别再让GPU内存拖后腿了:vLLM的PagedAttention如何像操作系统一样管理KV Cache
  • Qwen3.5-9B算法精讲与代码实现:从排序到动态规划
  • PADS-LOGIC模块化原理图设计实战:从基础设置到MCU电路集成
  • Keil Debug菜单Reset选项详解:HWreset、sysresetReq、Vectreset到底怎么选?
  • 卷积神经网络与GME多模态模型的对比分析:在图像特征提取上的异同
  • VisualCppRedist AIO:终极Visual C++运行库一站式解决方案完全指南