请问Qwen modelscope的模型文件与huggingface的模型文件是一致的吗？推理demo Qwen-VL

请问xi现在是否支持vllm加速 <a href="https://docs.vllm.ai/en/latest/models/supported_models.h

请问huggingface中多出的这三个文件作用，应该如何使用。 <a target="_blank" rel="noopener noreferrer" href

<a target="_blank" rel="noopener noreferrer" href="https://private-user-images.githubu

请问按照readme lora合并保存模型 <a target="_blank" rel="noopener noreferrer" href="https://p

推理时发现跟没训练几乎没区别 lora训练后数参数，如何知道正在合并到了新的整体模型中了 <a target="_blank" rel="noopener

<a target="_blank" rel="noopener noreferrer nofollow" href="https://priva

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

关于推理预测 about qwen-vl HOT 17 OPEN

elesun2018 commented on August 26, 2024

关于推理预测

from qwen-vl.

Comments (17)

elesun2018 commented on August 26, 2024 1

请问xi现在是否支持vllm加速
https://docs.vllm.ai/en/latest/models/supported_models.html

如何才能支持VLLM加速，谢谢

from qwen-vl.

elesun2018 commented on August 26, 2024

请问huggingface中多出的这三个文件作用，应该如何使用。

from qwen-vl.

elesun2018 commented on August 26, 2024

用lora微调qwen-vl模型，用peft merge_and_unload save_pretrained保存成huggingface模型文件
用Qwen-VL# python web_demo_mm.py加载这个huggingface模型文件进行推理，报错：
assert generation_config.chat_format == 'chatml', _ERROR_BAD_CHAT_FORMAT
AssertionError: We detect you are probably using the pretrained model (rather than chat model) for chatting, since the chat_format in generation_config is not "chatml".
If you are directly using the model downloaded from Huggingface, please make sure you are using our "Qwen/Qwen-7B-Chat" Huggingface model (rather than "Qwen/Qwen-7B") when you call model.chat().
我们检测到您可能在使用预训练模型（而非chat模型）进行多轮chat，因为您当前在generation_config指定的chat_format，并未设置为我们在对话中所支持的"chatml"格式。
如果您在直接使用我们从Huggingface提供的模型，请确保您在调用model.chat()时，使用的是"Qwen/Qwen-7B-Chat"模型（而非"Qwen/Qwen-7B"预训练模型）。

请问如何修改，谢谢！

from qwen-vl.

elesun2018 commented on August 26, 2024

这三个文件是要直接拷贝近huggingface模型文件output_qwen_hf ？

from qwen-vl.

elesun2018 commented on August 26, 2024

请问按照readme lora合并保存模型

没看到加载预训练路径的代码，AutoPeftModelForCausalLM这个会自动下载huggingface上的 QwenVL预训练模型吗，他是根据哪个配置选项自动下载QwenVL还是Qwen chat模型文件的？

from qwen-vl.

elesun2018 commented on August 26, 2024

请问什么是ChatML格式

from qwen-vl.

elesun2018 commented on August 26, 2024

推理时发现跟没训练几乎没区别
lora训练后数参数，如何知道正在合并到了新的整体模型中了

谢谢

from qwen-vl.

elesun2018 commented on August 26, 2024

能否帮忙解答一下，谢谢

from qwen-vl.

fanshuaiyao commented on August 26, 2024

这三个文件是要直接拷贝近huggingface模型文件output_qwen_hf ？

我是这个干的也成功了但是预测的效果很不好

from qwen-vl.

elesun2018 commented on August 26, 2024

@fanshuaiyao 跟这个有关系么？

from qwen-vl.

elesun2018 commented on August 26, 2024

请问如何将LLM（lm_head）输出概率值shift_logits转换成文本答案text。
经过：
predict_ids = np.argmax(results.shift_logits, axis=-1)
text = tokenizer.batch_decode(predict_ids, skip_special_tokens=True)
发现text 绝大部分为乱码显示。
谢谢！

from qwen-vl.

elesun2018 commented on August 26, 2024

能否解答一下上述几个问题，谢谢！

from qwen-vl.

elesun2018 commented on August 26, 2024

发现huggingface预训练模型中tokenizer的tokenizer_config.json与fientune tokenizer.save_pretrained保存的内容不太一致！

clean_up和model_max_length
请问这些参数不同有没有影响，谢谢！

from qwen-vl.

elesun2018 commented on August 26, 2024

能否解答一下上述几个问题，谢谢！

from qwen-vl.

elesun2018 commented on August 26, 2024

能否解答一下上述几个问题，谢谢！

from qwen-vl.

elesun2018 commented on August 26, 2024

现在我用trainer model merge融合后的模型做trainer.predict推理结果正常准确率还可以，就是web infer几乎没有效果，模型本身应该没有问题，不知应从哪里开始排查

from qwen-vl.

elesun2018 commented on August 26, 2024

lm head为151936，tokenizer为151860，目前只有peft lm head resize 151860有效果。

from qwen-vl.

关于推理预测 about qwen-vl HOT 17 OPEN

Comments (17)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent