-
Notifications
You must be signed in to change notification settings - Fork 209
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
#开一个小白讨论帖,小白们集合呀! #15
Comments
mlx源码导入好像忘了什么,oh,对,如果你mlx没能导入,那你一定还记得mlx源码导入。 事先声明,如果你的目的只是导入项目而对讨论没有兴趣的话,那么我认为以下内容帮不到你,因为我也没能成功。我认为这与环境的python版本有关而非与导入方式有关。但如果和我一样对代码很感兴趣的话,作为一个小白以下内容可能对你有用,因为它让我学习到了很多。 mlx是苹果发布的机器学习框架,题主称其whisper函数就是基于mlx开发的。因此,mlx对于程序是不可缺少的。
我按照gpt的说法,找到了mlx的wheel文件
但很可惜,没能成功。
在mlx的文档中我查找到了下载code导入的方法
由于方法一已经使用过了,我采用的是使用python API的方法。方法如下:
//用pip构建并下载
其中,env代指创建的虚拟环境;CMAKE_BUILD_PARALLEL_LEVEL=""设置环境变量,设置为空可能是为了禁用并行构建;’pip install .‘ ,其中‘ . '代表目录下的项目,该指令会自行查找项目中的setup.py并用setuptools来安装。因此我将下载的文件夹也放入voice-assistant-main,通过cp在voice-assistant-main中打开并执行了以上命令。 //在此报错
|
牛逼啊楼主 |
我很久以前遇到过这个问题,当时也是发现 conda 环境下 pyaudio 导入会报错。解决办法是不使用 anaconda,直接在主环境里运行这个程序,后来运行过几次之后不知道为什么在 conda 环境里也可以了。 |
mlx这个问题其实是因为在pypi源上只有macosx_13_0,macosx_14_0,以及python38,39,310,311,312的支持。所以如果不在这10个组合里,通过pip install mlx是无法找到这个mlx包的。 我的电脑是macOS Monterey,也就是macosx_12_0,conda环境指定的python版本为3.11。在这样的配置下,通过修改下载的mlx安装包 |
mlx的一些补充在经过一些试验后,我意识到无法使用pip并非是python版本的原因,而是arm环境的原因。因为我曾执行过以下代码
按照mlx的文档,我改进了第一条代码,使其环境为arm架构
CONDA_SUBDIR=osx-arm64代表环境参数为osx-arm64,确保所有的软件和工具都是arm架构的。这可能也对于非M芯片用户也有效。
如果输出arm就是,不是的话,mlx文档的build and install会给你解决的方法。这是针对pip install 的解决方案。由于我没能完成源码导入,也希望你能想我分享你是如何成功通过源码导入mlx的。 新进展感谢[linyiLYi]的思路分享。我尝试了在主环境中运行程序,但由于缺少mlx,所以目前来说仍没有结果。
同时我也尝试了我的新环境,但令人沮丧的是,它仍然有问题,出现了以下的报错
其问题在于使用源文件夹导入numpy,但在我找到numpy并把它拖到桌面后,仍然无法解决这个问题。 更新的进展家人们,它没问题!在我删除anaconda下载minianaconda后,它开始运行了! 昨天码的字结果没发上[捂脸],村里果然没通网。本来想重复一遍截屏报错的,结果阴差阳错运行了 |
M2 MAX 64G内存,一直遇到这个报错,调整 CHANNELS 参数无效,看过pyaudio的文档,以及重装也无用。[I] ◆ voice-assistant git:(main) ✗ ❯❯❯ python main.py (VoiceAI) |
你好[ulooocom]
这应该是由于通道数设置不匹配导致的OSError,因为在原main代码中设置了CHANNELS=1表示希望使用单声道,但在错误消息中表示你尝试使用CHANNELS=2立体声模式打开流。可能你并没有给你的hear立体声模式的权限, 如果你还有什么问题,你可以询问ChartGPT,虽然它无法解决所有问题,但它在解释代码原理方面很有作用。 |
我周末更新完系统之后就能够正常运行了,笔记本配置为MBP M2 16G。不过因为内存的关系,目前只能加载6B的模型。从效果上来说,蛮一般的,有时候回答会直接从Prompt里摘取内容,有时候会陷入一直重复说话,一个回复里面一句话能重复十几次。 顺便去了解了下Bert-VITS2,这个蛮有意思的,不过看起来如果从回复及时朗读的话,性能还是比较大的问题。 |
有个问题,为什么whisper在windows下要替换成speech_recognition?直接用有问题吗? |
本项目中的whisper是用的mlx, 这是苹果芯片M系列上的库,所以在windows下要替换成别的库。 |
这可能与所选ai版本有关,可能34B会更流畅。在题主的演示视频中,他使用128G+34B也用了5318ms |
请问在windows下mlx库要如何平替?修改相关代码吗 |
现在这套whisper 是苹果m芯片专供,去官网下一套就行。 |
用的是m2 ultra, 先尝试的是6b的模型,感觉还挺有意思的。就是有时会抽风。我叹了口气(input就是sigh),她之后说了一堆脑筋急转弯的东西,而且还把同样的东西重复了三次。。。接下来试试34b。不过运行起来还是很开心的。 一个小点:我的电脑报了ffmpeg的error,然后我才发现我conda没装这个: |
所以目前Windows是无法安装这个库的,对吗? |
謝了老兄,我正想著ffmpeg是啥,沒想到一行代碼就搞定了 |
我的macbook pro是10年前的 没法跑这个代码 Windows 又没法跑这个代码 ....郁闷 |
要换电脑了 |
mlx这个包要怎么解决?Windows环境下 |
win10 的电脑,看到up 的视频就兴冲冲过来了,mlx 的包,折磨了很久。第一次发现在github 原来还有评论区功能,所以mlx 一定要用mac 电脑才能运行吗? |
对,而且还只能使用m芯片的。 |
开一个小白讨论帖,欢迎大家讨论,祝大家早日拥有自己的ai派蒙
事情是这样的,我在b站看到这个项目,十分感兴趣。但作为一个小白,题主所写对我来说十分笼统,在尝试两天后我任然无法解决其中的bug。看到有许多小白和我一样不知所措,为此我打算分享我目前得到的成果,以供大家讨论并应对具体的事项。
系统:mac 13.4和14.2,我在调试过程中还升级了一次lol
芯片:m1芯片,21年机型
首先,你需要下载anaconda和brew,
anaconda链接在此:
12.16更新:anaconda在删除后让我成功避免了一些错误,因此下载miniconda是推荐的
brew选择国内源下载
然后打开题主下载代码中的readme文件在终端中输入前两行代码
遇到弹出填y,这主要是建立一个虚拟环境,之后你会发现你前面的括号内容发生变化了
打开anaconda,在环境中找到voice ai,以后就不用再配置环境了,在这里启动终端就可以💗
接着,通过路径打开你下载的文件夹
这里cd是打开文件夹的命令,打开后这一点要是没弄清楚,小白很容易在后一步卡住。我是图省事就放桌面了,同时hear和models我也放在voice-assistant-main中,这也可能导致我之后的错误。
执行pip install -r requirements.txt
要是出现pip命令找不到就尝试pip3
这一步最容易出现的错误是mlx下载错误,我查mlx下载手册(https://ml-explore.github.io/mlx/build/html/install.html)显示使用pip install mlx 需要用native Python >= 3.8,MacOS >= 13.3,但这个环境python = 3.11,就找不到资源。
但我按照mlx文档所说的步骤构建native环境,发现torch不支持这个平台,也会报错所以进退两难了。
我的做法是打开requirements.txt,删除mlx,尝试通过源码导入,但也失败了,这个我们之后再说。
执行 CMAKE_ARGS="-DLLAMA_METAL=on" pip install llama-cpp-python
这一点我基本不会报错,等一会就好了。
下载portaudio和pyaudio
复制代码输入就好,这里我也不会报错错。
下载gguf和hear
这里我找到了镜像源
有多种gguf能够下载,我下载的是这个
下载完毕后,我放到voice-assistant-main中建立的models文件(这是我新建的文件夹)
同时按照题主描述下载hear并执行sudo bash install.sh,这大概是我最先成功的事情。
运行程序
重头戏来了,如果你前面msl没有报错,那你是比我幸运得多的幸运儿,恭喜你可以运行程序了(大概?)
注意看你是否还在voice-assistant-main,如果没在则用cd折跃;如果在的话,执行python main.py(这是我在题主视频里看到的)
若你得到以上输出,那么我也无能为力,因为我也止步于此!如果你能运行,那么恭喜你,也欢迎你向我分享你的喜悦与运行方法。
这个问题的描述是这样的,主要与pyaudio有关
主要是在执行导入pyaudio时执行__init__.py第111行出错输出的,我重复了很多遍还是无法解决
以下是我找到的试图解决这个问题的方法,但都对我无效,希望能祝你度此难关。
所以我希望大家一起讨论,看看能不能解决这个问题,如果是bug的话就只能等更新了,不发出来我心痒痒。
这是我第一次写issue,我也才接触github两天,其中肯定有许多错误。若果有什么错误或者遗漏,也请经快与我讨论。
写到最后才发现题主是我校友[捂脸],献丑了…… 也希望题主能够早日更新,早日实现“让大家分分钟拥有自己的ai语音助手”的承诺。
The text was updated successfully, but these errors were encountered: