给之前弄的 Flappy Anna 3D 游戏做了款纯视觉 AI, FSD 风格:像素进动作出
http://xhslink.com/o/z9OE1VyNW5
视觉 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 118 篇相关文章 · 第 1 / 6 页
http://xhslink.com/o/z9OE1VyNW5
这两年尝试过很多表层方面(自己训练、视觉理解),都没法突破。已知的商业api(旷世等)成本太高,我感觉陷入很大瓶颈 万能的佬友们,希望能够指点1、2 2 个帖子 - 2 位参与者 阅读完整话题
比如说我要在后台录入一个信息 网页的开发接口我获取不到,只能手动输入信息 在A网页的某个固定的表单里复制信息 再到B网页的一个表单里粘贴信息 目前有没有自动化工具,可以像人一样,看完一遍操作之后,重复完成后续的工作? 这个工具可以“看到”这个固定的表单、不同的信息 感觉纯用AI来
3 个帖子 - 3 位参与者 阅读完整话题
类别悬浮占用的区域太大了,其实只要下面一办就行。还有颜色的视觉效果看起来很累没有旧主题这么轻松,可能是覆盖率太高 2 个帖子 - 2 位参与者 阅读完整话题
计算机视觉方向入门看视频的顺序是什么样的啊 2 个帖子 - 2 位参与者 阅读完整话题
接了一个导师的OCR项目,具体需求是控制相机移动并识别出芯片的型号和方向。 目前遇到了一些视觉方面相关的问题,也就是打光和图像处理这一块。我目前的打光方案是一上一下的明暗视野方案, 是白光直射环形灯, 是红光45度斜射环形灯, 是我芯片所处的位置,可见下图。遇到的问题是,正常芯片
模型:Gemini3 Pro 【 您可以立即刷新页面,感受这套顶级 UI 带来的视觉冲击力。 】 3 个帖子 - 3 位参与者 阅读完整话题
IT之家 5 月 14 日消息,博主 @数码闲聊站 今日分享了某厂新机 6.9"±2K LIPO 极窄四等边直面板效果图。据称,盖板做了微四曲面设计,中框与盖板有特殊衔接工艺,视觉边框在 0.3-0.5mm±, 接近无边框视觉效果 。 博主还在评论区补充称:“BOE 独
今日,小米正式发布—— Xiaomi OneVL:一步式潜空间语言视觉推理框架。该模型在业内率先实现 VLA、世界模型、潜空间推理等多个技术路线的统一,在具备 XLA 模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案,在精度上超越显式 CoT、在速度
本人做水下3D视觉,Dataset/Benchmark赛道,一轮评分5232,置信度4544。2分看着有点吓人,不过给的问题不算多,给我补了几篇引用。5分审稿人高度赞扬我的工作而且问了我巨多问题,ta的问题基本涵盖了其他所有审稿人的问题,可能是我在不幸中比较幸运的事情了 有同学投
IT之家 5 月 12 日消息,苹果今天还更新了 Apple Developer 应用,为其带来了 Liquid Glass 风格改版,并为开发者提供了多款可在 Messages 应用中使用的 WWDC 主题贴纸。 重新设计的 Apple Developer 应用采用了全新的 L
cad出的图 一个1.4m大小 300dpi 宽度 7016 高度 4961,deepseek/mimo效果完全不行. 用qwen3max /vl 都没有问题. 还有提前推荐的吗,我对比测试选一下 9 个帖子 - 8 位参与者 阅读完整话题
IT之家 5 月 11 日消息,特斯拉官方 5 月 9 日晒出视频,表示特斯拉视觉系统可以在特斯拉检测到不可避免的碰撞时, 提前 70 毫秒弹出安全气囊 ,从而降低受伤的风险。 特斯拉 CEO 埃隆 · 马斯克对此表示:特斯拉 AI 视觉系统在撞击前弹出安全气囊,大大降低了受伤或
求解!!!! 2 个帖子 - 2 位参与者 阅读完整话题
本人研二,最近在某机器人公司实习,入职一周了。做的是视觉slam相关的工作,虽然在学校的时候做的也是这一块的工作,但是入职之后发现自己的代码能力很弱,尝尝感觉到很焦虑。同样是实习的同事能够在一天之内迭代两版代码,虽然我也积极的使用vibe coding,但是我通过cluade或者
尝试了几种AI代理,都是在各种实现方式里面循环尝试和打转,api、UI、com等等,每到一个新的场景或新的软件,就需要各种新任务拆分和路径尝试,有没有可能,仅用截图+OCR文字识别+图片理解+模拟键鼠,自建一个电脑端的通用AI代理? 1 个帖子 - 1 位参与者 阅读完整话题
内嵌HTML代替纯Markdown:让大模型回复不再又臭又长 - 开发调优 - LINUX DO Claude Code 团队成员发文:是时候用 HTML 替代 Markdown 了 - 前沿快讯 - LINUX DO 前面我发布了两个讨论使用Html内嵌渲染来解决目前简单Mar
今天给老板整理名为“多模态大模型对传统视觉算法的冲击”报告,写着写着,就开始胡思乱想:在多模态大模型逐步进入工业、安防、医疗、交通、教育等高价值场景后,AI模型已经不再只是一个被动工具,而开始参与复杂场景理解、风险判断和辅助决策。那我们如何判断AI模型“能做什么、不能做什么、应该
计算机专业,老师说是搞计算机视觉的,但是应该也是连服务器吧我想,因为提前说让我掌握liunx操作。现在手里有台2060的拯救者,想着今年618换MacBook air,但是不知道要怎么选择配置。目前的想法是 16+512 15寸、 24+512 13寸 还是说再加1500 买个2