视觉 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

视觉 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 118 篇相关文章 · 第 1 / 6 页

给之前弄的 Flappy Anna 3D 游戏做了款纯视觉 AI, FSD 风格:像素进动作出

http://xhslink.com/o/z9OE1VyNW5

tech V2EX - 技术 2026-05-21 19:28:39+08:00

求推荐-视觉柜识别技术能够用于生产

这两年尝试过很多表层方面(自己训练、视觉理解),都没法突破。已知的商业api(旷世等)成本太高,我感觉陷入很大瓶颈 万能的佬友们,希望能够指点1、2 2 个帖子 - 2 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-19 20:36:41+08:00

有没有基于“视觉”的AI&自动化工具?

比如说我要在后台录入一个信息 网页的开发接口我获取不到,只能手动输入信息 在A网页的某个固定的表单里复制信息 再到B网页的一个表单里粘贴信息 目前有没有自动化工具,可以像人一样,看完一遍操作之后,重复完成后续的工作? 这个工具可以“看到”这个固定的表单、不同的信息 感觉纯用AI来

tech LinuxDo 最新话题 2026-05-19 13:43:28+08:00

网页版qwen 3.7似乎不支持视觉

3 个帖子 - 3 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-19 00:21:24+08:00

新的主题样式优化建议

类别悬浮占用的区域太大了,其实只要下面一办就行。还有颜色的视觉效果看起来很累没有旧主题这么轻松,可能是覆盖率太高 2 个帖子 - 2 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-16 14:16:01+08:00

各位佬友们好呀

计算机视觉方向入门看视频的顺序是什么样的啊 2 个帖子 - 2 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-15 07:49:01+08:00

这一篇求助贴,请做视觉的佬友帮忙给点打光方案的建议

接了一个导师的OCR项目,具体需求是控制相机移动并识别出芯片的型号和方向。 目前遇到了一些视觉方面相关的问题,也就是打光和图像处理这一块。我目前的打光方案是一上一下的明暗视野方案, 是白光直射环形灯, 是红光45度斜射环形灯, 是我芯片所处的位置,可见下图。遇到的问题是,正常芯片

tech LinuxDo 最新话题 2026-05-15 01:05:31+08:00

有时候写着写着就气笑了

模型:Gemini3 Pro 【 您可以立即刷新页面,感受这套顶级 UI 带来的视觉冲击力。 】 3 个帖子 - 3 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-14 19:11:44+08:00

某厂 6.9"±2K LIPO 极窄四等边直面板效果图曝光:视觉接近无边框,预计由 OPPO 新机搭载

IT之家 5 月 14 日消息,博主 @数码闲聊站 今日分享了某厂新机 6.9"±2K LIPO 极窄四等边直面板效果图。据称,盖板做了微四曲面设计,中框与盖板有特殊衔接工艺,视觉边框在 0.3-0.5mm±, 接近无边框视觉效果 。 博主还在评论区补充称:“BOE 独

tech IT之家 2026-05-14 13:10:36+08:00

小米开源Xiaomi OneVL 自动驾驶模型

今日,小米正式发布—— Xiaomi OneVL:一步式潜空间语言视觉推理框架。该模型在业内率先实现 VLA、世界模型、潜空间推理等多个技术路线的统一,在具备 XLA 模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案,在精度上超越显式 CoT、在速度

tech LinuxDo 最新话题 2026-05-13 17:41:26+08:00

ECCV_26交流帖

本人做水下3D视觉,Dataset/Benchmark赛道,一轮评分5232,置信度4544。2分看着有点吓人,不过给的问题不算多,给我补了几篇引用。5分审稿人高度赞扬我的工作而且问了我巨多问题,ta的问题基本涵盖了其他所有审稿人的问题,可能是我在不幸中比较幸运的事情了 有同学投

tech LinuxDo 最新话题 2026-05-13 16:15:48+08:00

苹果开发者 App 完成“液态玻璃”视觉重塑,新增多款 WWDC 2026 贴纸

IT之家 5 月 12 日消息,苹果今天还更新了 Apple Developer 应用,为其带来了 Liquid Glass 风格改版,并为开发者提供了多款可在 Messages 应用中使用的 WWDC 主题贴纸。 重新设计的 Apple Developer 应用采用了全新的 L

tech IT之家 2026-05-12 06:49:26+08:00

视觉模型有没有推荐,测试deepseek/mimo都很差

cad出的图 一个1.4m大小 300dpi 宽度 7016 高度 4961,deepseek/mimo效果完全不行. 用qwen3max /vl 都没有问题. 还有提前推荐的吗,我对比测试选一下 9 个帖子 - 8 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-11 19:38:07+08:00

特斯拉用 AI 视觉系统预测碰撞:提前 70 毫秒弹出安全气囊,未来车型标配

IT之家 5 月 11 日消息,特斯拉官方 5 月 9 日晒出视频,表示特斯拉视觉系统可以在特斯拉检测到不可避免的碰撞时, 提前 70 毫秒弹出安全气囊 ,从而降低受伤的风险。 特斯拉 CEO 埃隆 · 马斯克对此表示:特斯拉 AI 视觉系统在撞击前弹出安全气囊,大大降低了受伤或

tech IT之家 2026-05-11 09:01:22+08:00

pi coding agent里如何开启GPT5.5的视觉功能?

求解!!!! 2 个帖子 - 2 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-10 23:15:09+08:00

如何能够提高代码能力

本人研二,最近在某机器人公司实习,入职一周了。做的是视觉slam相关的工作,虽然在学校的时候做的也是这一块的工作,但是入职之后发现自己的代码能力很弱,尝尝感觉到很焦虑。同样是实习的同事能够在一天之内迭代两版代码,虽然我也积极的使用vibe coding,但是我通过cluade或者

tech LinuxDo 最新话题 2026-05-10 21:18:32+08:00

AI代理走纯视觉方案是否可行?

尝试了几种AI代理,都是在各种实现方式里面循环尝试和打转,api、UI、com等等,每到一个新的场景或新的软件,就需要各种新任务拆分和路径尝试,有没有可能,仅用截图+OCR文字识别+图片理解+模拟键鼠,自建一个电脑端的通用AI代理? 1 个帖子 - 1 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-10 00:34:46+08:00

解决大模型回复又臭又长:内嵌HTML代替纯Markdown——成本和视觉效果的取舍

内嵌HTML代替纯Markdown:让大模型回复不再又臭又长 - 开发调优 - LINUX DO Claude Code 团队成员发文:是时候用 HTML 替代 Markdown 了 - 前沿快讯 - LINUX DO 前面我发布了两个讨论使用Html内嵌渲染来解决目前简单Mar

tech LinuxDo 最新话题 2026-05-09 18:53:54+08:00

AI大模型的边界问题随想

今天给老板整理名为“多模态大模型对传统视觉算法的冲击”报告,写着写着,就开始胡思乱想:在多模态大模型逐步进入工业、安防、医疗、交通、教育等高价值场景后,AI模型已经不再只是一个被动工具,而开始参与复杂场景理解、风险判断和辅助决策。那我们如何判断AI模型“能做什么、不能做什么、应该

tech LinuxDo 最新话题 2026-05-09 15:52:42+08:00

Macbook配置选择(研0)

计算机专业,老师说是搞计算机视觉的,但是应该也是连服务器吧我想,因为提前说让我掌握liunx操作。现在手里有台2060的拯救者,想着今年618换MacBook air,但是不知道要怎么选择配置。目前的想法是 16+512 15寸、 24+512 13寸 还是说再加1500 买个2

tech LinuxDo 最新话题 2026-05-08 22:20:47+08:00