而类似严重注水的仓库,在GitHub上随处可见,买假星这事儿已经产业化了。
据Dagster在2023年的调查,造假甚至还能“丰俭由人”,假星有分层定价:
低价套餐多用批量注册的空白小号快速点星,容易触发风控;而高价服务会特意选用养号多年的优质老账号,模拟真人的浏览、点赞节奏,自然平缓涨星。
同时还附带售后保障,承诺长期锁星、避免被平台清理,伪装逻辑Max…
而且售卖渠道也毫无遮掩,市面上至少有12个网站公开售卖,Fiverr平台稳定有24个活跃卖家持续接单,甚至支持API支持程序化批量购买。
还没完,有需求就有市场,市面上甚至滋生出账号农场,专门养GitHub账号。
虽然贡献图全是刷的,但看起来比你还像个正经开发者(doge)。
那么,都是谁在买呢?
说起来很扎心,CMU研究显示,AI/LLM项目是GitHub刷星重灾区,在非恶意项目里造假数量排第一。
推荐算法也被造假团队玩明白了,论文统计显示有78个重度刷星的注水项目,靠着虚假热度成功挤进了GitHub Trending热门榜单。
不过,研究也证实,假星只有不到2个月的短期效果,时间一长反而会拖累真实热度,造成负向影响。
Star=融资入场券
那买Star干嘛呢?最大的原因可能还是为了搞钱。
单纯的技术优势很难快速打动投资人,直观可量化的外部数据,成了快速筛选的核心标准。
而GitHub Star数量,就是VC们最看重、最直观的流量硬指标。
知名投资机构Redpoint合伙人就曾公开过一个隐形门槛:
开源初创项目,种子轮融资的Star中位数是2850,A轮项目则需要达到4980。
于是创业者们拿起了计算器——
但这笔极小的投入,对应的收益却是天差地别。
△图源:Awesome Agents
头部风投Runa Capital每个季度发布都会发布业内极具参考性的增长最快开源项目榜单。
数据显示,68%的上榜项目能顺利拿下种子轮融资,累计总额高达1.69亿美元,是行业公认的优质项目风向标。
结果这份权威榜单排名第一、坐拥74000颗超高Stars的明星项目Union Labs,却被分析发现47.4%的Star疑似造假。
因为它的fork-to-Star比例只有0.052,而行业健康、真实活跃的开源项目,正常区间稳定在0.1–0.2。
所以恶性闭环也就形成了:VC看Star筛选项目→创业者买Star冲数据→VC看到假数据更信Star→更多人跟进→更多人买……
既然Star数不可信,那该看什么?
网友分享了自己的筛选方法,先看last commit date,越新的越好,说明有人维护。
然后再看项目年龄和更新频率,老项目只要还在稳定迭代,本身也算是质量保证。
此外,Issues和核心代码的质量也比较重要。
老哥也很真实了:星数能告诉我啥?它要么是上面这些因素带来的间接结果,要么就是纯纯的造假。反正想判断项目好坏,最终还是得回头看这些硬指标。
确实,虽然你可以买Star,但买不来一个真正帮你修bug的PR。
CMU研究:https://arxiv.org/abs/2412.13459
参考链接:
[1]https://awesomeagents.ai/news/github-fake-Stars-investigation/返回搜狐,查看更多