Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

7、开发者洞察 负责人 @bifenglin,@andyhuang18 #445

Open
Tracked by #438
will-ww opened this issue Dec 27, 2024 · 4 comments
Open
Tracked by #438

7、开发者洞察 负责人 @bifenglin,@andyhuang18 #445

will-ww opened this issue Dec 27, 2024 · 4 comments

Comments

@will-ww
Copy link
Contributor

will-ww commented Dec 27, 2024

以下给出一些分析建议,供参考,希望结合已有的内容进行优化和扩展~


七. 开发者洞察

整体目标

通过对全球和中国活跃开发者的地区分布、工作习惯、角色特征以及机器人行为的深度分析,揭示开源生态中开发者的参与格局、行为模式和贡献特点。重点分析中国开发者在全球开源社区中的参与度和影响力,同时探索机器人账号在开源协作中的作用。


7.1 开发者的地区分布

分析目标

  • 评估全球活跃开发者的地区分布,揭示开源生态的区域差异。
  • 特别关注中国开发者的分布和影响力,展现其在全球开源生态中的地位。

分析维度

  1. 全球活跃开发者分布
    • GitHub 活跃开发者的全球分布图。
    • 不同国家或地区的开发者数量占比。
  2. 中国开发者分布及影响力
    • 中国活跃 GitHub 开发者的地区分布。
    • 考虑 OpenRank 加权后的中国开发者影响力,展示影响力高的地区分布情况。

优化点

  • 对比全球开发者分布与项目分布的关联性,分析开发者与技术领域的区域匹配度。
  • 深入分析中国开发者在不同技术领域中的参与程度及影响力(如云原生、AI)。

可视化形式

  1. 地图热力图:展示全球和中国开发者的地区分布。
  2. 条形图:对比不同国家/地区的开发者数量和占比。
  3. 气泡图:以城市为单位展示中国开发者的影响力分布(结合 OpenRank 加权)。

预期洞见

  • 哪些国家或地区是全球开源开发者最活跃的中心。
  • 中国开发者是否有集中分布的区域(如北上广深等城市),以及这些区域的开发者影响力如何。
  • 不同地区的开发者分布是否与技术领域的热点相呼应。

7.2 开发者工作时间分析

分析目标

  • 解析开发者在 GitHub 上的工作时间分布,揭示全球和中国开发者的工作习惯。
  • 评估不同项目的工作时间分布,探索开发者参与项目的活跃时间段和行为模式。

分析维度

  1. 全域开发者工作时间分布
    • 全球范围内开发者在一天中的活跃时间段。
    • 不同国家/地区开发者的工作时间差异。
  2. 项目工作时间分布
    • 不同类型项目(如云原生、AI、大数据等)的开发者活跃时间段。
    • 项目生命周期(如新项目 vs 成熟项目)对工作时间分布的影响。

优化点

  • 增加对中国开发者工作时间的对比分析,探索其是否有独特的工作习惯(如夜间活跃度更高)。
  • 结合开发者所在的时区,分析全球协作的时间协调性。

可视化形式

  1. 热力图:展示全球开发者一天 24 小时的活跃度分布。
  2. 堆叠折线图:对比不同国家、地区或项目类型的工作时间分布。
  3. 柱状图:分析不同项目生命周期下的工作时间分布模式。

预期洞见

  • 开发者是否更倾向于在特定时间段(如工作日的白天或晚上)参与开源协作。
  • 不同国家/地区的开发者是否存在显著的工作时间差异。
  • 项目类型或生命周期是否对开发者的活跃时间分布产生影响。

7.3 开发者角色分析

分析目标

  • 根据开发者在开源项目中的贡献行为,分析其角色分布及演化特点。
  • 评估 2024 年新增开发者在不同角色中的贡献情况,揭示新兴开发者的参与模式。

分析维度

  1. 各角色数量分布
    • 开发者角色分类(如核心贡献者、活跃贡献者、普通贡献者)。
    • 不同角色的数量占比及区域分布。
  2. 2024 年新增开发者角色分布
    • 新增开发者在不同角色中的分布。
    • 新增开发者对头部项目的贡献情况。
  3. 开发者角色演化
    • 开发者从普通贡献者向活跃贡献者、核心贡献者演化的路径。
    • 开发者角色演化的影响因素(如参与项目的类型和数量)。

优化点

  • 增加对中国开发者角色分布的分析,揭示中国开发者在全球开源项目中的角色定位。
  • 深入探索哪些因素(如技术领域、项目类型)推动了开发者角色的演化。

可视化形式

  1. 饼图:展示各角色的数量分布。
  2. 堆叠柱状图:对比 2024 年新增开发者在不同角色中的分布。
  3. 时间序列折线图:展示开发者角色演化的路径和趋势。

预期洞见

  • 核心贡献者是否集中在少数国家/地区或特定技术领域。
  • 新增开发者是否更倾向于参与特定类型的项目(如生成式 AI)。
  • 开发者角色演化是否存在明显的路径和规律。

7.4 机器人账号分析

分析目标

  • 挖掘机器人账号在开源协作中的作用和行为模式,评估其对开源生态的影响。
  • 通过机器人活跃度和事件类型分析,揭示机器人在不同项目中的协作特点。

分析维度

  1. 机器人活跃数据分析
    • 机器人账号的数量及活跃度(如提交代码、创建 Issue)。
    • 不同国家/地区项目中机器人的参与度。
  2. 机器人事件类型分析
    • 机器人账号处理的事件类型(如代码检查、自动化测试)。
    • 不同技术领域项目中机器人的事件分布。
  3. 机器人工作时间分布
    • 机器人在不同时间段的活跃情况。
    • 机器人与人类开发者工作时间分布的交互模式。
  4. GitHub 协作机器人事件数量排行榜
    • 最常用的协作机器人(如 Dependabot、Renovate)的事件数量排行及应用场景。

优化点

  • 对比头部项目与普通项目中机器人账号的使用比例,探索机器人对项目效率的提升作用。
  • 增加对中国项目中机器人使用情况的分析,评估中国团队对协作机器人的依赖程度。

可视化形式

  1. 条形图:展示不同机器人账号的事件数量排行。
  2. 饼图:展示机器人事件类型的分布。
  3. 热力图:展示机器人工作时间与人类开发者的协作分布。

预期洞见

  • 机器人是否在某些领域(如 AI、云原生)中更广泛应用。
  • 不同事件类型(如代码检查 vs 自动化部署)是否有显著的机器人参与比例。
  • 协作机器人是否显著提升了开源项目的协作效率。

新增内容建议

7.5 开发者协作网络分析

  • 分析目标
    • 通过开发者之间的协作网络,评估全球和中国开发者的协作模式。
    • 探索头部开发者在开源项目中的网络中心性及影响力。
  • 分析维度
    1. 开发者协作网络的结构特征(如中心性、密度)。
    2. 不同国家/地区开发者之间的协作强度。
    3. 头部开发者与普通开发者的协作关系。
  • 可视化形式
    1. 网络关系图:展示开发者协作网络的结构。
    2. 矩阵热力图:展示不同国家/地区开发者的协作强度。
  • 预期洞见
    • 中国开发者是否与全球开发者形成了紧密的协作网络。
    • 头部开发者是否在开源协作中扮演了核心角色。
@bifenglin
Copy link
Contributor

bifenglin commented Jan 1, 2025

每年机器人参与的仓库机器人账号事件与全部事件数量对比图

Comparison statistics of annual bot events and overall events (2016-2024)

2024年机器人账号事件数与所有事件数对比图

Proportion of Bot Events to All Events

每年机器人账号不同事件类型对比图(2016-2024)

GitHub Bot Event Counts by Year (2016-2024)

2024年与2023年各个事件变化率

op and Bottom Growth Rates in GitHub Event Counts (2023 vs 2024)

机器人账号7X24小时活跃热力图

7×24 Hour Heatmap of Bot Account Activities (2024)

@andyhuang18
Copy link

andyhuang18 commented Jan 1, 2025

7.1 开发者的地区分布

7.1.1 GitHub 活跃开发者地理分布

图 7-1 2024 全球开发者分布图

image

图 7-2 2024 中国开发者分布图

image

7.1.2 GitHub 活跃开发者国家 / 地区分布

图 7-3 2024 全球 GitHub 活跃开发者国家 / 地区分布图

image

表 7-1 2024 全球活跃开发者数量国家 / 地区排名

排名 国家 2024年数量 2023年数量 增长数量 增长率 (%)
1 United States 435,202 236,899 198,303 83.71
2 India 252,054 107,067 144,987 135.42
3 China 184,085 113,893 70,192 61.63
4 Brazil 174,811 83,932 90,879 108.28
5 Germany 126,397 64,836 61,561 94.95
6 United Kingdom 103,061 55,175 47,886 86.80
7 Canada 82,627 42,238 40,389 95.62
8 France 78,288 40,341 37,947 94.08
9 Russia 60,735 31,534 29,201 92.60
10 South Korea 44,006 21,811 22,195 101.77

图 7-4 2024 中国 GitHub 活跃开发者地区分布图

image

表 7-2 2024 中国活跃开发者数量地区排名

排名 地区 2024数量 2023数量 增长数量 增长率 (%)
1 北京 38,323 24,151 14,172 58.69
2 上海 28,393 18,215 10,178 55.86
3 广东 24,959 16,153 8,806 54.51
4 台湾 15,894 8,823 7,071 80.15
5 浙江 15,816 10,927 4,889 44.74
6 江苏 9,369 5,437 3,932 72.34
7 四川 8,186 5,311 2,875 54.14
8 香港 6,625 3,344 3,281 98.10
9 湖北 5,732 3,273 2,459 75.13
10 陕西 3,669 1,993 1,676 84.11

@andyhuang18
Copy link

andyhuang18 commented Jan 1, 2025

7.2 开发者工作时间分析

7.2.1 全域开发者工作时间分布

图 7-5 GitHub 全域开发者工作时间分布

image

图 7-6 Gitee 全域开发者工作时间分布

image

图 7-7 除去机器人的全域开发者时间分布

image

7.2.2 项目工作时间分布

全球 GitHub 仓库 OpenRank 前四名工作时间分布

  1. NixOS/nixpkgs
image
  1. llvm/llvm-project
image
  1. home-assistant/core
image
  1. pytorch/pytorch
image

中国仓库 OpenRank 前四名工作时间分布

  1. openharmony
image
  1. DaoCloud
image
  1. PaddlePaddle
image
  1. doris
image

@andyhuang18
Copy link

andyhuang18 commented Jan 2, 2025

7.3 开发者角色分析

7.3.1 2024 年各角色数量分布

表 7-3 OpenRank 排名前 10 项目各开发者角色数量分布

仓库名 探索者 参与者 贡献者 提交者
NixOS/nixpkgs 4897 3606 4339 3484
llvm/llvm-project 6789 3241 2365 2092
home-assistant/core 10596 7472 1300 989
pytorch/pytorch 12513 2599 1424 823
digitalinnovationone/dio-lab-open-source 3813 4462 21276 224
odoo/odoo 7659 650 1035 661
microsoft/vscode 14701 12522 579 388
DigitalPlatDev/FreeDomain 32967 35332 3 0
zephyrproject-rtos/zephyr 2314 1054 1276 1120
godotengine/godot 15208 3314 1072 678

图 7-5 开发者角色分布图

image

7.3.2 2024 年各角色新增情况

表 7-4 OpenRank 排名前 10 项目新增开发者角色数量分布

仓库名 新增探索者 新增参与者 新增贡献者 新增提交者
NixOS/nixpkgs 4836 2392 2187 1605
llvm/llvm-project 6689 2191 1517 1223
home-assistant/core 10483 5502 819 565
pytorch/pytorch 12321 1938 946 496
digitalinnovationone/dio-lab-open-source 3809 4455 21254 224
odoo/odoo 7559 445 467 239
microsoft/vscode 14416 10614 450 312
DigitalPlatDev/FreeDomain 32967 35332 3 0
zephyrproject-rtos/zephyr 2278 687 690 554
godotengine/godot 14774 2216 738 445

图 7-6 2024 年开源社区角色新增图

image

7.3.3 开发者演化视角

表 7-5 OpenRank 排名前 10 项目角色转化数量分布

仓库名 贡献者 -> 提交者 参与者 -> 贡献者 探索者 -> 参与者
NixOS/nixpkgs 287 188 204
llvm/llvm-project 134 289 185
home-assistant/core 66 103 155
pytorch/pytorch 82 78 168
digitalinnovationone/dio-lab-open-source 0 21 3
odoo/odoo 48 33 28
microsoft/vscode 23 50 272
DigitalPlatDev/FreeDomain 0 0 0
zephyrproject-rtos/zephyr 62 45 46
godotengine/godot 67 115 242

图 7-7 开发者角色演化图

image

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants