About 50 results
Open links in new tab
  1. 如何看待 Meta 发布 Llama3,并将推出 400B+ 版本? - 知乎

    -如果Meta 的LLAMA-3系列全面开源,甚至之后的LLAMA-4也持续开源(目前看这个可能性是较大的,Meta的开源决心比较大,相比而言,谷歌还是决心不太够,商业利益考虑更多些),那么国内应 …

  2. 做大模型RL后训练,用huggingface/trl还是用llama-factory?

    14B模型,我用llama-factory做过reward model的lora训练和PPO的lora训练,具体训练脚本可以看我的两篇文章。 PPO训练实践——基于llamafactory训练框架 和 RewardModel 训练实践——基 …

  3. 如何评价 Meta 刚刚发布的 LLama 4 系列大模型? - 知乎

    Apr 5, 2025 · 如何评价 Meta 刚刚发布的 LLama 4 系列大模型? 刚刚,当地时间2025年4月5日,Meta 发布了 Llama 4 系列模型。 [图片] 其中的Maveric的预览版已经登录LMArena,以141… 显示全部 关 …

  4. Meta 发布模型 Llama 3,实际体验效果如何? - 知乎

    Llama 3 70B 的能力,已经可以和 Claude 3 Sonnet 与 Gemini 1.5 Pro 等量齐观,甚至都已经超过了去年的两款 GPT-4 。 更有意思的,就是价格了。实际上,不论是 8B 和 70B 的 Llama 3 ,你都可以在本 …

  5. Meta 发布开源可商用模型 Llama 2,实际体验效果如何?

    LLaMA-2-chat 几乎是开源模型中唯一做了 RLHF 的模型。 这个东西太贵了,Meta 真是大功一件! 根据下图的结果,LLaMA-2 经过 5 轮 RLHF 后,在 Meta 自己的 reward 模型与 GPT-4 的评价下,都表 …

  6. llama3 它来了,你如何看待llama3? - 知乎

    这个新模型在如MedQA和MedMCQA等标准基准测试中超越了所有同类参数的开放模型。 你可以在这里阅读更多关于耶鲁大学和洛桑联邦理工学院如何在Llama 2基础上构建Meditron的首个版本的信息。 …

  7. 为什么都在用ollama而lm studio却更少人使用? - 知乎

    3. 还有一点,ollama是llama.cpp实现模型推理,模型小,速度快。 4. 还有,ollama提供11434端口的web服务,重要的是还兼容openai的端点接口,可以和各种前端配合,比如ollama自己open webui, …

  8. 草泥马是alpaca还是llama,两者的区别主要是什么? - 知乎

    Final复习中 有一门课叫做introduction to livestock 它的final包括三部分 其中part1是breed identification 有Camelids。 Camelids主要包括 双峰驼 单峰驼 原驼 美洲驼 羊驼 小羊驼 骆驼camel包括双峰 …

  9. 如何评价Llama 4? - 知乎

    Apr 5, 2025 · https://www.llama.com/ 混饭吃而已,个人公众号: 会做饭的螃蟹

  10. 怎么看待Llama3.1依旧不支持中文的现状? - 知乎

    Jul 25, 2024 · Llama系列模型一直对中文支持都比较差,是中文模型比较难吗?还是其它原因?