首页 综合资讯

3w + 星标项目大佬创业:树莓派即可运行大模型

2023-06-27 14:06:55

高级开发人员终于忍无可忍,开始自己创业。

,今年3月份,我开源了llama.cpp项目,已经破了3万颗星,而且只有8.8k。

这个项目允许开发者在没有GPU的情况下运行Meta的LLaMA模型,即使是在 Pi上运行大型模型也很容易~

△ 在 M2 Max 上以 40 tok/s 的速度运行 7B LLaMA

它甚至吸引了 Zha 的注意:Meta 也在运行 llama.cpp。

或许是因为反响很大,这位大佬决定拿出背后的核心纯C语言框架ggml来创业:几个月前本来只是一个副业项目。

在正式宣布之前,该公司已获得前 Y 合伙人 Gross 的种子前投资。

消息一出,不少开发商前来祝贺。

其中有一些坚定的支持者:ggml 正在将大型模型引入边缘设备。

没过多久,就有人建议苹果收购它。 (狗头)

llama.cpp 作者 创业

ggml是一个纯C语言编写的张量库,可以帮助开发者在消费级硬件上运行大型模型,星数达到百思特网4.4k。

由于惊人的加速效果,立即获得了众多开发者的支持。

对了,ggml中的gg恰好是他名字的首字母。

老大哥自己的两个star数上万的项目llama.cpp和.cpp都使用了它。

后者是为自动语音识别模型开发的加速解决方案,可以在 Mac、Linux、iOS、、 Pi 和 Web 上运行。

△ 在树莓派上使用.cpp检测短语音命令

很多初创公司,比如主生活搜索引擎,都采用了这种解决方案。

终端上还同时运行着两个项目。

△ 在单个M1Pro上同时运行4个13B LLaMA+ Small实例

据我个人介绍,ggml张量库有以下特点:

支持16位浮点数; 支持整数量化(包括4位、5位、8位);百思特网 自动微分; 内置优化算法(如ADAM、L-BFGS); 针对Apple芯片设置特定优化; 在 x86 架构上使用 AVX / AVX2 ; 通过 WASM SIMD 进行 Web 支持; 无第三方依赖; 运行时零内存分配; 支持定向语言输出...

目前这个库及相关项目都是免费开源的,开发过程也完全开放; 当然,也不排除出于某些商业目的开发授权项目。

用 C/C++ 重写神经网络代码

而这背后的开发老板也值得一说。

他的个人网站非常简单,抛出了各种开源项目,但没有太多其他内容。 看得出来他是一个C/C++的粉丝,并且相信Vim。

此前,他用C/C++语言重写了神经网络推理代码,几乎不依赖其他百思特网库,提高了效率。 至于llama.cpp,他也是一夜之间就出来了。

此外,他还有一些有趣的项目。

比如检查键盘是否可以通过麦克风窃听、猜测新闻标题、克隆等。

还有一件事

值得一提的是,背后的两位投资人也有点意思。

他们还专门为创业者提供算力集群,只需在网站上申请即可。 这波更上一层楼了~

参考链接:

本文地址:https://m.best73.com/zdmzt/270171.html
特别声明:以上内容来源于编辑整理发布,如有不妥之处,请与我方联系删除处理。
相关资讯
通用大模型的“矛”与“盾”
2023-06-28 发布
李开复创业大模型公司“零一万物”官网上线:致力于打造全新的 AI 2.0 平台
2023-07-04 发布
国产大模型“群雄逐鹿”:科大讯飞“星火认知大模型”何以更胜一筹?
2023-07-05 发布
在树莓派 4 等设备上
2023-07-27 发布
万达大玩家 游戏种类(万达大玩家游戏项目)
2023-12-18 发布
最新资讯
时刻报警主机键盘说明书(报警主机键盘布防)
2024-04-26 发布
什么样的智能手机好(智能手机哪种好用又实惠)
2024-04-26 发布
微软平板电脑使用说明(平板微软电脑说明使用方法)
2024-04-26 发布
笔记本电脑能以旧换新(笔记本能旧换电脑新的吗)
2024-04-26 发布
用手机能除去马赛克吗(马赛克手机去除工具哪个最有效)
2024-04-26 发布
蓝牙适配器什么牌子好(蓝牙牌子适配器好用吗)
2024-04-26 发布
小米盒子连接上笔记本(盒子笔记本小米连接上没反应)
2024-04-26 发布
中国电子学会无线电定位技术分会(无线电定位系统)
2024-04-26 发布
手机上怎么看音基360(安卓版音基app)
2024-04-26 发布
自助发卡机拍照验证身份像走过场(自助发卡机拍照验证身份像走过场)
2024-04-26 发布
更多资讯 >
热门资讯
更多资讯 >