视觉 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技

给之前弄的 Flappy Anna 3D 游戏做了款纯视觉 AI， FSD 风格：像素进动作出

http://xhslink.com/o/z9OE1VyNW5

tech V2EX - 技术 2026-05-21 19:28:39+08:00

求推荐-视觉柜识别技术能够用于生产

这两年尝试过很多表层方面（自己训练、视觉理解），都没法突破。已知的商业api（旷世等）成本太高，我感觉陷入很大瓶颈万能的佬友们，希望能够指点1、2 2 个帖子 - 2 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-19 20:36:41+08:00

有没有基于“视觉”的AI&自动化工具？

比如说我要在后台录入一个信息网页的开发接口我获取不到，只能手动输入信息在A网页的某个固定的表单里复制信息再到B网页的一个表单里粘贴信息目前有没有自动化工具，可以像人一样，看完一遍操作之后，重复完成后续的工作？这个工具可以“看到”这个固定的表单、不同的信息感觉纯用AI来

tech LinuxDo 最新话题 2026-05-19 13:43:28+08:00

网页版qwen 3.7似乎不支持视觉

3 个帖子 - 3 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-19 00:21:24+08:00

新的主题样式优化建议

类别悬浮占用的区域太大了，其实只要下面一办就行。还有颜色的视觉效果看起来很累没有旧主题这么轻松，可能是覆盖率太高 2 个帖子 - 2 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-16 14:16:01+08:00

各位佬友们好呀

计算机视觉方向入门看视频的顺序是什么样的啊 2 个帖子 - 2 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-15 07:49:01+08:00

这一篇求助贴，请做视觉的佬友帮忙给点打光方案的建议

接了一个导师的OCR项目，具体需求是控制相机移动并识别出芯片的型号和方向。目前遇到了一些视觉方面相关的问题，也就是打光和图像处理这一块。我目前的打光方案是一上一下的明暗视野方案，是白光直射环形灯，是红光45度斜射环形灯，是我芯片所处的位置，可见下图。遇到的问题是，正常芯片

tech LinuxDo 最新话题 2026-05-15 01:05:31+08:00

有时候写着写着就气笑了

模型：Gemini3 Pro 【您可以立即刷新页面，感受这套顶级 UI 带来的视觉冲击力。】 3 个帖子 - 3 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-14 19:11:44+08:00

某厂 6.9"±2K LIPO 极窄四等边直面板效果图曝光：视觉接近无边框，预计由 OPPO 新机搭载

IT之家 5 月 14 日消息，博主 @数码闲聊站今日分享了某厂新机 6.9"±2K LIPO 极窄四等边直面板效果图。据称，盖板做了微四曲面设计，中框与盖板有特殊衔接工艺，视觉边框在 0.3-0.5mm±，接近无边框视觉效果。博主还在评论区补充称：“BOE 独

tech IT之家 2026-05-14 13:10:36+08:00

小米开源Xiaomi OneVL 自动驾驶模型

今日，小米正式发布—— Xiaomi OneVL：一步式潜空间语言视觉推理框架。该模型在业内率先实现 VLA、世界模型、潜空间推理等多个技术路线的统一，在具备 XLA 模型强悍推理能力的基础上，大幅提升了推理的速度和精度，是行业内具备开创性的方案，在精度上超越显式 CoT、在速度

tech LinuxDo 最新话题 2026-05-13 17:41:26+08:00

ECCV_26交流帖

本人做水下3D视觉，Dataset/Benchmark赛道，一轮评分5232，置信度4544。2分看着有点吓人，不过给的问题不算多，给我补了几篇引用。5分审稿人高度赞扬我的工作而且问了我巨多问题，ta的问题基本涵盖了其他所有审稿人的问题，可能是我在不幸中比较幸运的事情了有同学投

tech LinuxDo 最新话题 2026-05-13 16:15:48+08:00

苹果开发者 App 完成“液态玻璃”视觉重塑，新增多款 WWDC 2026 贴纸

IT之家 5 月 12 日消息，苹果今天还更新了 Apple Developer 应用，为其带来了 Liquid Glass 风格改版，并为开发者提供了多款可在 Messages 应用中使用的 WWDC 主题贴纸。重新设计的 Apple Developer 应用采用了全新的 L

tech IT之家 2026-05-12 06:49:26+08:00

视觉模型有没有推荐,测试deepseek/mimo都很差

cad出的图一个1.4m大小 300dpi 宽度 7016 高度 4961,deepseek/mimo效果完全不行. 用qwen3max /vl 都没有问题. 还有提前推荐的吗,我对比测试选一下 9 个帖子 - 8 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-11 19:38:07+08:00

特斯拉用 AI 视觉系统预测碰撞：提前 70 毫秒弹出安全气囊，未来车型标配

IT之家 5 月 11 日消息，特斯拉官方 5 月 9 日晒出视频，表示特斯拉视觉系统可以在特斯拉检测到不可避免的碰撞时，提前 70 毫秒弹出安全气囊，从而降低受伤的风险。特斯拉 CEO 埃隆 · 马斯克对此表示：特斯拉 AI 视觉系统在撞击前弹出安全气囊，大大降低了受伤或

tech IT之家 2026-05-11 09:01:22+08:00

pi coding agent里如何开启GPT5.5的视觉功能？

求解！！！！ 2 个帖子 - 2 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-10 23:15:09+08:00

如何能够提高代码能力

本人研二，最近在某机器人公司实习，入职一周了。做的是视觉slam相关的工作，虽然在学校的时候做的也是这一块的工作，但是入职之后发现自己的代码能力很弱，尝尝感觉到很焦虑。同样是实习的同事能够在一天之内迭代两版代码，虽然我也积极的使用vibe coding，但是我通过cluade或者

tech LinuxDo 最新话题 2026-05-10 21:18:32+08:00

AI代理走纯视觉方案是否可行？

尝试了几种AI代理，都是在各种实现方式里面循环尝试和打转，api、UI、com等等，每到一个新的场景或新的软件，就需要各种新任务拆分和路径尝试，有没有可能，仅用截图+OCR文字识别+图片理解+模拟键鼠，自建一个电脑端的通用AI代理？ 1 个帖子 - 1 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-10 00:34:46+08:00

解决大模型回复又臭又长：内嵌HTML代替纯Markdown——成本和视觉效果的取舍

内嵌HTML代替纯Markdown：让大模型回复不再又臭又长 - 开发调优 - LINUX DO Claude Code 团队成员发文：是时候用 HTML 替代 Markdown 了 - 前沿快讯 - LINUX DO 前面我发布了两个讨论使用Html内嵌渲染来解决目前简单Mar

tech LinuxDo 最新话题 2026-05-09 18:53:54+08:00

AI大模型的边界问题随想

今天给老板整理名为“多模态大模型对传统视觉算法的冲击”报告，写着写着，就开始胡思乱想：在多模态大模型逐步进入工业、安防、医疗、交通、教育等高价值场景后，AI模型已经不再只是一个被动工具，而开始参与复杂场景理解、风险判断和辅助决策。那我们如何判断AI模型“能做什么、不能做什么、应该

tech LinuxDo 最新话题 2026-05-09 15:52:42+08:00

Macbook配置选择（研0）

计算机专业，老师说是搞计算机视觉的，但是应该也是连服务器吧我想，因为提前说让我掌握liunx操作。现在手里有台2060的拯救者，想着今年618换MacBook air，但是不知道要怎么选择配置。目前的想法是 16+512 15寸、 24+512 13寸还是说再加1500 买个2

tech LinuxDo 最新话题 2026-05-08 22:20:47+08:00

视觉 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

相关标签