Sam:现在我们可以开始将 AI 纳入讨论了,这让我非常兴奋。首先谈谈 AI 部署的不同阶段。
我认为 AI 部署主要分为三个阶段:数据准备、模型开发和模型部署。结合我们之前讨论的术语
【参见上篇】,这些术语与 AI 部署的不同阶段有何关联?
Emrah: 实际上,AI 部署的所有阶段都可以通过 Docker 容器完成。如果是生产级部署,就应该使用 Kubernetes,或者更理想的情况是通过 Helm 图表进行配置。这是我们在进行产品研发和团队合作时遵循的方法,代表了业内广泛认可的最佳实践。不过需要注意的是,这些并非唯一可行方案。
在决定将 AI 的哪些组件或阶段迁移到云端时,需要考虑可扩展性、灵活性和资源利用率在哪些环节最具价值。例如,数据流庞大且需要大量预处理的工作负载能极大受益于云的扩展能力。模型的反复训练和评估过程同样能从中获益。在部署期间,云能提供必要的可视化管理能力。
归根结底,在需要高度可扩展性和灵活性的 AI 应用场景中,云能带来最显著的优势。
Emrah: 无论是数据还是应用,大多数企业实际上已经在采用混合云模式——部分数据和应用部署在云端,其余则保留在本地。由于技术和位置差异,要实现数据同步并构建统一管道始终存在挑战。虽然将所有数据迁移至一个云看似简单,但这往往不切实际。更务实的做法是,我们需要做好在混合环境中运作的准备,并解决随之而来的难题。
在这种混合环境中,最大的挑战之一是保障数据安全,防范恶意访问。从这个角度看,主要风险点并非基础设施本身,而是网络层面的安全隐患。另一方面,如果网络足够安全,那么各种技术的同步问题就可能成为另一个挑战。
尽管将所有资源集中部署是理想状态,但我们不会强制客户采用这种方案,而是帮助他们建立足够的能力和信心,使其能够从容管理所依赖的环境(无论是纯云还是混合架构)。
Emrah: 影响的程度取决于他们的使用情况以及与基础设施的连接程度。数据工程师是最接近基础设施的群体,他们使用的工具直接受到基础设施相关技术选择的影响。他们需要能在任何环境中使用为其选定的技术进行操作。
相比之下,数据科学家是否受影响则不确定。他们与基础设施的接近程度取决于所用工具及其使用方式。
工业工程师作为最终用户,与基础设施的关联最弱。他们使用的应用程序即便底层基础设施发生变化,很可能也浑然不觉。
Emrah: 这个问题可以通过边缘计算 (Edge Computing) 这种混合架构来解决。虽然边缘计算仍然在本地运行,但它利用云技术来缓解延迟问题。企业可以自主决定哪些组件在云端运行,哪些组件在边缘端运行。只要二者之间实现无缝集成,延迟问题就能降到最低。
云端环境为 AI 开发者带来的优势
正如我们此前讨论的,选择云端还是本地基础建设,通常取决于灵活性、可扩展性和成本效益的需求。然而,云端环境的选用也深受数据需求的影响。在处理海量数据(无论是公共还是私有数据)时,云技术至关重要。这是因为容器化和 Kubernetes 等工具能简化任务流程,使 AI 开发者能更专注于开发,而非数据管理和基础设施配置。云提供多重优势,使其成为 AI 开发人员更理想的工作环境。
作者简介
Samantha 是 SmartFactory AI™ Productivity、Simulation AutoSched™ 和 Simulation AutoMod™的全球产品经理。在加入应用材料公司自动化产品事业部之前,她曾担任博世工业4.0项目经理,并曾任数据科学家一职。早期她还曾作为研究助理任职于橡树岭国家实验室地理信息科学与技术组。Samantha 持有田纳西大学诺克斯维尔分校数学硕士学位,以及北乔治亚大学达洛尼加分校数学学士学位。
Emrah带领团队为半导体制造商提供 AI/ML 解决方案及自动化软件产品的云转型服务。他是 SaaS 应用开发、云转型实践以及云计算优化与分析框架构建领域的先驱,拥有半导体制造、云分析和零售科学领域的多项专利,并在半导体排程与规划领域拥有丰富的研究经验。他的研究成果发表在 IEEE 和 INFORMS 等国际期刊,并在 IERC 和 INFORMS 等会议上进行过展示。他获得德克萨斯大学奥斯汀分校运筹学与工业工程博士学位,还拥有土耳其比尔肯特大学工业工程学士学位和硕士学位。