图像 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技

求助各位佬友，codex返回这个"图像生成技能要求优先用内置 image_gen，但当前工具集中没有暴露这个能力"

这样子要怎么处理，有佬友支招吗，让codex自己修找不到问题出在哪里 6 个帖子 - 3 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-24 09:28:31+08:00

关于火山coding plan的doubao seed 2.0 pro模型用于图像理解

想问各位佬友一个问题，我想用豆包的模型去扫一些古籍和手写档案，但是单调用api太贵了，所以想买个coding plan的套餐，是不是会更划算一点。但是火山的套餐口碑好像不太好，额度不透明而且用的很快，所以我想问问佬友们，是选择直充api划算还是买coding plan划算，或者有

tech LinuxDo 最新话题 2026-05-23 15:47:46+08:00

OpenAI ChatGPT 解锁 AI 填表技能：图像识别、语音输入和自动补全

IT之家 5 月 23 日消息，OpenAI 今天（5 月 23 日）发布公告，宣布 ChatGPT 解锁新技能，用户上传表单后，可直接用语音或文字说明填写内容，系统会识别表单字段、自动补全信息。在最新演示中，用户上传一份健身会员表单后，只需口头说明姓名、地址和健身目标，Ch

tech IT之家 2026-05-23 14:38:18+08:00

[分享创造] 精选 X 上的图片提示词开源社区 - Open Prompts

Open Prompts 是一个开源的 AI 图像提示词平台：把散落在文档和社群里的提示词整理成可复用的模板（含预览图、标签、模型与公开范围），在画廊里发现、在创作页一键出图、也可提交或管理自己的模板。适合需要统一沉淀提示词、团队共享、公开画廊 + 私有草稿的创作者与小

tech v2ex 2026-05-22 23:37:07+08:00

剪映海外版Capcut宣布跟 Gemini 合作

剪映海外版Capcut宣布跟 Gemini 合作了未来可以在Gemini里使用剪映的编辑功能去编辑图像视频 9 个帖子 - 6 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-21 23:55:57+08:00

国家药监局批准染色体核型图像辅助诊断软件上市，可自动完成染色体的切割、计数及异常辅助提示等

IT之家 5 月 21 日消息，据国家药监局新闻宣传中心公众号“中国药闻”分享，近日，国家药品监督管理局批准了杭州德适生物科技股份有限公司的染色体核型图像辅助诊断软件注册申请。据介绍，该产品由软件安装光盘和 U 盾组成，软件功能模块包括用户登录界面模块、主界面模块和分析界面模块

tech IT之家 2026-05-21 14:02:19+08:00

思特威推出三款超大靶面超高分辨率工业图像传感器，4500 万 / 3000 万 / 2000 万像素

IT之家 5 月 21 日消息，思特威今天推出超大靶面超高分辨率工业相机应用系列图像传感器 SC4880RS (45MP)、SC3080RS (30MP) 及 SC2080RS（20MP），基于 SmartClarity-3 平台打造，采用掩膜拼接工艺，对高温性能和长曝光成像

tech IT之家 2026-05-21 13:03:15+08:00

验证 OpenAI 生成的图像上传图片，即可检验该图像是否出自 OpenAI 的 AI 工具之手

https://openai.com/zh-Hans-CN/research/verify/ https://github.com/wiltodelta/remove-ai-watermarks 关于 CLI 和库用于去除图像中可见（ Gemini ）和不可见（ SynthID

tech V2EX - 技术 2026-05-20 22:52:18+08:00

求佬友指导一下就业方向

目前研一，bg是双非本2硕，之前0实习经历，目前研究方向是图像质量评估以及生成模型优化。最近想找个实习（第一篇论文快到收尾阶段了，但是老板要求做两篇，因此可能要偷偷实习，边实习边做第二篇工作），想着找个多模态的跟研究方向契合的，但是同门说多模态属于是算法的，门槛非常高，他觉得ag

tech LinuxDo 最新话题 2026-05-20 21:57:57+08:00

隐形水印 + C2PA 元数据，OpenAI 推出双重 AI 生成图像溯源举措

IT之家 5 月 20 日消息，如今各类 AI 图像生成工具层出不穷，且功能日益强大，想要分辨一张图片是否真实变得前所未有的困难。本周二，OpenAI 推出两项新举措，助力解决这一问题。 IT之家注意到，该公司已承诺采用名为 C2PA 的开放标准，该标准会在图片元数据中留下明确标

tech IT之家 2026-05-20 16:23:22+08:00

Google正在让AI图像的制作变得容易也让深度伪造图像易于被识别

随着AI图像生成技术日益强大，深度伪造和其他虚假图像变得越来越难以识别。尽管Google不断演进的Gemini套件在一定程度上助长了这一趋势，但该公司正试图通过更广泛地推广新的水印和检测系统来控制这项技术。 Google最新推出的AI图像编辑工具Google Pics旨在让照片修

tech cnBeta全文版 2026-05-20 12:35:38+08:00

[慢讯]字节竟然开源了？ Lance多模态大模型开源，支持图像视频输入和生成！

最近抱抱脸上看到字节开源了个Any-to-Any模型（字节好久没开源过东西了吧），支持图像视频输入理解和生成 huggingface.co bytedance-research/Lance · Hugging Face We’re on a journey to advance

tech LinuxDo 最新话题 2026-05-20 10:07:20+08:00

:fire:【图像视频系列8】关于Gemini-omni-flash，你想知道的一切

Gemini-omni-flash在5月19日Google IO 26大会上发布模型主页： Gemini Omni — Google DeepMind 提示词指南： How to create effective prompts with Gemini Omni — Googl

tech LinuxDo 最新话题 2026-05-20 04:06:26+08:00

[分享创造] 做了一个集成了 Veo 3.1、Seedance 2.0、ChatGPT Image 2.0、Happy Horse 1.0 的一站式 AI 视频/图像平台，免费送积分

大家好，分享一个我最近在做的项目： FastMoro AI （ fastmoroai.com ）简单来说，就是把目前主流的 AI 视频和图像模型整合到一个平台里，不用到处切换账号、不用管 API 配额，一个地方搞定。集成了哪些模型？能做什么？平台集成了 4 款主流 AI 模

tech v2ex 2026-05-19 20:03:49+08:00

找个全职远程工作，多年数字孪生图像仿真工程师会建模熟悉着色器

之前给研究所做星模拟器航空数字孪生项目比如在轨维修太空态势这些女朋友在云南的小城市当老师，软件岗位比较少，工资低一些也可以，传统应用客户端开发也没问题，qt java web都可以 2 个帖子 - 2 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-19 18:07:35+08:00

鸿蒙智行问界 M7 汽车累计交付突破 45 万台，896 线双光路图像级激光雷达版本 30.98 万元起

IT之家 5 月 19 日消息，鸿蒙智行官方今日宣布，定位“幸福旗舰”的问界 M7 累计交付已突破 45 万台。回顾问界 M7，该车长宽高分别为 5080×1999×1780mm、轴距 3030mm，提供大五座、享六座布局，五座版后备箱容积可达 850L，放倒后拓展至 21

tech IT之家 2026-05-19 10:16:30+08:00

图像: 半夜突然想到的一个怪异场景【tHe mIrror moon】

咱自己也不知道为什么会想出这么一个怪东西，大概是窝有1.4了吧，至少水到了文本(raw)：那里的天空是纯黑的，没有其它星球，没有任何其它光点，只有一个巨大的静态地球贴图，地面本该没有光源，但却是仿佛相机过度曝光的样子，极其极其极其明亮到刺眼，但它们却又不发出任何光线，无法照亮任

tech LinuxDo 最新话题 2026-05-18 23:14:02+08:00

想问一下各位大佬，gpt20xpro 图像imagine2生成额度多少呀

想问一下各位大佬，gpt20xpro 图像imagine2生成额度多少呀 1 个帖子 - 1 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-18 23:11:07+08:00

有没有佬友做过图像数据集的版本管理

背景是我手里有很多图像标注数据,外包的标注数据回来后我们会做一些数据清洗和标注修正,但是可能修正后过一段时间需求变了,数据需要进一步清洗… 想要记录每条数据版本的变化并支持回滚,类似于git,但数据量太大git不太好使,有没有佬友有相关工具推荐的 7 个帖子 - 3 位参与者阅

tech LinuxDo 最新话题 2026-05-14 15:28:36+08:00

这回合gemini在图像识别上赢了gpt

如图昨天我打算出掉这个apple pencil ,为买家提供序列号时，实在是看不清，于是就拍照发给了AI ,经过我去官网查验 gemini 识别的是正确的， gpt嘛直接就没看出来豆包呢识别错了 1 个帖子 - 1 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-14 09:29:10+08:00

图像 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

相关标签