请教如何推算模型部署需要的显存
如题,以模型minimax m2.5(原本权重,先不考虑量化)为例,如何知道这个模型具体需要多大的显存才可以部署? 另外,NPU还是GPU应该没多大区别吧,主要是看显存多少。 请佬们指条明路 12 个帖子 - 9 位参与者 阅读完整话题
请教 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第16页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 459 篇相关文章 · 第 16 / 23 页
如题,以模型minimax m2.5(原本权重,先不考虑量化)为例,如何知道这个模型具体需要多大的显存才可以部署? 另外,NPU还是GPU应该没多大区别吧,主要是看显存多少。 请佬们指条明路 12 个帖子 - 9 位参与者 阅读完整话题
自建的 Coding Plan ,gpt-5.3-codex 和 gpt 5.4 模型 coding 时候的正常首 token 返回,响应基本不超过 1 秒( 5W input token 左右的情况) 这个 plan 是面向 coding 用户的,现在计划在下面两种定价方式里选
自建的 Coding Plan ,gpt-5.3-codex 和 gpt 5.4 模型 coding 时候的正常首 token 返回,响应基本不超过 1 秒( 5W input token 左右的情况) 这个 plan 是面向 coding 用户的,现在计划在下面两种定价方式里选
L站大佬们好,遇到一个网络环境配置的问题,想请教一下解决方案。 我自己的Ubuntu Server服务器做了内网穿透,然后安装了 cli-proxy-api 想做代理,供我自己用,现在卡在访问openAi网站上,网上的梯子都是要求有图形化界面才能运行,我不想在服务器上安装GUI程
估计明天凌晨开始,codex将荣登AI人士最不可缺少的全能开发工具(兼具日常问答),因为据说5.5pro也会在codex上可以用了。但现在有个问题,如果codex和chatgpt的额度是分开算的话?那我的pro额度不是x2倍? 所以有知道的小伙伴说说这gpt的额度是两个应用分开算
我通过Cc-switch 管理claude_code的配置,之前其他的中转站都能配置成功,在anyroute的配置是一直存在问题,访问不到,现在我的账户还有500$的额度,但是一次都没有访问上,调用次数为0,下面是我的cc-switch的配置,请求大佬指点迷津,搞定了请大佬喝咖啡
上篇帖子已经找到了充值plus订阅的方法,也已经是用上了 Codex的桌面应用中可视化做的比较好,所以比较倾向于使用这个,但是oh-my-codex说是在cli中发挥比较好,所以问一下各位佬,有没有桌面应用推荐的插件或者技能啊 1 个帖子 - 1 位参与者 阅读完整话题
3 个帖子 - 3 位参与者 阅读完整话题
自建的 Coding Plan ,gpt-5.3-codex 和 gpt 5.4 模型 coding 时候的正常首 token 返回,响应基本不超过 1 秒( 5W input token 左右的情况) 这个 plan 是面向 coding 用户的,现在计划在下面两种定价方式里选
自建的 Coding Plan ,gpt-5.3-codex 和 gpt 5.4 模型 coding 时候的正常首 token 返回,响应基本不超过 1 秒( 5W input token 左右的情况) 这个 plan 是面向 coding 用户的,现在计划在下面两种定价方式里选
各位大佬们,我想请教一下如何获取CSI300和SP500成分股公司过去十年的历史新闻数据。之前试过yahoo finance,新浪财经和东方财富来爬取新闻,效果不是很理想。希望有经验的大佬不吝赐教 3 个帖子 - 3 位参与者 阅读完整话题
RT,有个渠道比官网稍贵,请教下佬友如何验证是否掺水?或者我先买了上架HUB站,佬友们给试试(大约需要多少刀)? 2 个帖子 - 2 位参与者 阅读完整话题
1.第一次配置cc,使用公益站的模型后总是有这个报错 2.还有一个问题,cc里面一定要走本地路由才能用这个插件吗,我的配置有问题吗 4 个帖子 - 2 位参与者 阅读完整话题
佬友们,请教下问题。 GPT直接注册,不跳add_phone, 但是通过cpa oauth登录注册,则跳转add_phone? 有佬友遇到嘛? 可以先注册gpt账号,然后f12,找到对应的refresh_token这个路子吗? 6 个帖子 - 3 位参与者 阅读完整话题
自建的 Coding Plan ,gpt-5.3-codex 和 gpt 5.4 模型 coding 时候的正常首 token 返回,响应基本不超过 1 秒( 5W input token 左右的情况) 这个 plan 是面向 coding 用户的,现在计划在下面两种定价方式里选
想请教一下各位佬友,头像右下角的小尾巴去哪里申请获取呢? 3 个帖子 - 2 位参与者 阅读完整话题
我目前是把codex官方订阅配置到ccs,只配置了一个,我想用cpa,我把ccs上官方订阅的auth.json保存下来,在cpa的认证文件上传,但是感觉没有识别出是codex,模型也显示“该凭证暂无可用模型”,有佬知道是我哪里弄错了吗?json内容格式{ “auth_mode”:
请问这两种方式的专业术语叫什么? 一种是 列出计划-用户确认-执行计划 一种是 列出计划-无需用户确认-自动执行 4 个帖子 - 4 位参与者 阅读完整话题
各位佬友这个Any可不可以配置到龙虾使用?我尝试配置到龙虾可是一直报错,各位佬友能不能提供下教程 14 个帖子 - 7 位参与者 阅读完整话题
请教下兄弟们,我目前有两个gptplus账号,如何正确导入到ccswitch进行切换使用呢?主要场景就是替代手动退出登录账号这个流程。 我尝试了分别登录两个账号,获取各自的auth.json和config.toml分别放入两个官方供应商设置里,但是显示的两个账号是同一个,切换并不