积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部云计算&大数据(11)Kubernetes(11)

语言

全部中文(简体)(9)英语(1)中文(简体)(1)

格式

全部PDF文档 PDF(10)PPT文档 PPT(1)
 
本次搜索耗时 0.020 秒,为您找到相关结果约 11 个.
  • 全部
  • 云计算&大数据
  • Kubernetes
  • 全部
  • 中文(简体)
  • 英语
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 运维上海2017-机器学习模型训练的Kubernetes实践-袁晓沛

    0 码力 | 39 页 | 5.82 MB | 1 年前
    3
  • pdf文档 第29 期| 2023 年9 月- 技术雷达

    的早期阶段,但到目前为止,ReAct 及其后继方法已指引出大语言模型最令人兴奋的一些应用领域。 10. 检索增强生成 试验 检索增强生成(RAG) 是一种结合预训练参数和非参数记忆的文本生成技术。它使你能够通过你的领域内特有 的包含上下文的知识,来强化预训练模型中的现有知识。使用 RAG,你会先从非参数记忆中去检索相关文档集 (一般是通过在向量数据库中的相似性搜索),再使用 LLM 中的参数记忆生成与检索出的文档一致的输出。我们 OWASP 十大安全风险榜单。 但鲜为人知的是 OWASP 也在其他领域发布了类似的十大榜单。在八月初发表了第一个主要版本的 OWASP LLM 十大安全风险榜单 强调了提示注入、不安全的输出处理、训练数据投毒以及其他个人和团队构建 LLM 应用程序 时最好注意的风险。OWASP 近期也发布了 OWASP API 十大安全风险榜单的第二版。鉴于 OWASP 十大安全风 险榜单的覆盖范围(Web 组件并不容易。已经出现了一些框架来简化这一过程,甚至一些框架中还使用了浏览器引 擎,但复杂性仍然存在。比开发人员体验更糟糕的是用户体验:当必须在浏览器中加载和构建自定义 Web 组件 时,页面加载性能会受到影响,即使在预渲染和精心调整组件的情况下,也几乎无法避免“无样式内容闪烁” 或某些布局变化。放弃使用 Web 组件的决定可能会产生深远的影响,正如我们的一个团队曾经不得不将其基于 Web 组件的设计系统 Stencil
    0 码力 | 43 页 | 2.76 MB | 1 年前
    3
  • pdf文档 Alluxio 助力 Kubernetes, 加速云端深度学习

    问题背景 • Alluxio 助力云原生 AI 模型训练 • 相关资料 • Alluxio 是谁 • Allluxio 与 Kubernetes 结合 • Alluxio 优化实践 我们是谁? 车漾 阿里云高级技术专家 范斌 Alluxio 创始成员 背景 硬件 软件 数据 容器化的基础架构 人工智能发展的驱动力 模拟数据训练速度 311.6 7323.84 9993.6 RestNet50 模型训练速度(images/second) 分布式训练/GPU硬件升级加速明显 模拟数据训练时间 108 15.12 4.62 3.39 1 0 20 40 60 80 100 120 P100 (1GPU) P100 (8GPU) P100 (32GPU) V100 (8GPU) V100 (32GPU) RestNet50 模型训练时间(hours) 单机缓存无法满足海量数据加速 9993.6 3189.6 0 2000 4000 6000 8000 10000 12000 Synthetic ESSD云盘 PL2 RestNet50 模型训练速度 (images/second) 云盘 Alluxio - 分布式缓存的领导者 开源项目由李浩源博士(Alluxio公司CEO)在加州大学Berkeley分校 AMPLab就读期间创立 2013
    0 码力 | 22 页 | 11.79 MB | 1 年前
    3
  • ppt文档 GPU Resource Management On JDOS

    Kubeflow 的机器学习训练服务 3.模型管理和模型 Serving 服务 Experiment Training Serving 均基于容器,不对业务方直接提供 GPU 物理机 GPU 实验 JDOS 常规的容器服务 ,使用 gpu 的 zone , 自行设定相应的镜像即 可,有完善的周边服务 训练服务 • 提供基于 kubeflow 的分布式训练方案 – 界面化操作,用户提供代码地址和执行命令即可 自制存储插件支持分布式文件系统存储用户数据 – 支持官方镜像,不需要 JDOS 提前协助制作镜像 – 提供 tensorboard 作为训练监控实时查看训练状态 – 用户训练完成后释放 GPU 资源,提高 GPU 利用率 – Job 调度 (部门 quota 限制 + 优先级) • 创建训练 – 用户选择集群提供代码地址和执行命令即可 – 选择所用框架(镜像):支持官方,亦可自制 (提供 dockerfile 可以选择是否监控训练,提供 tensorboard 任务列表 可以指定 git 的 commit-id 发起任务 任务详情 可以查看具体的容器列表,以及查看容器的日志和事件 Serving 服务 提供统一便捷的 Serving 服务,只需用户指定模型,即可提供 grpc 和 rest 服务,同时使用 GPU 复用 +HPA 提高 GPU 利用率 创建 Serving 与训练集成 • 用户只需要简单选择机房和
    0 码力 | 11 页 | 13.40 MB | 1 年前
    3
  • pdf文档 运维上海2017-Kubernetes与AI相结合架构、落地解析-赵慧智

    AI 工程师的大部分工作都是在 做数据预处理的部分,而可视 化 UI 则可以大大减少 AI 工程 师的工作量。 AI 工具及其研发框架的整合 模型训练资源池管理 • AI 模型训练会耗费巨大的资源并且长时间占用 • 多个用户在模型训练时需要通过队列的方式来解决资源短缺 问题 • 需要对不同用户进行资源池划分 模型管理与发布 • 模型发布: • 模型服务的负载均衡 • 模型管理: • 模型的版本 • 模型的类型 研发环境与生产环境隔离 • 硬件资源互相隔离 • 网络资源相互连通 资源监控及分配策略 • 用户资源的限制 • - 创建训练任务的限制 • - 创建模型服务的限制 • 资源使用的负载均衡状况 • - 总体资源使用的状况 • - 单个用户的资源使用状况 Kubernetes 介绍 Kubernetes Kubernetes 作为 AI 平 台的一个核心调度和任 务管理平台 • AI 业务层负责将具体 的业务逻辑实现,并与 Kubernetes 层对接 • 在底层硬件选型需要注 意适合 AI 模型训练和 在线服务的类型,例如 10G及以上的 networking和GPU TensorFlow 介绍 • TensorFlow™ 是一个使用数据流图进行数值计算的开源软件 库。图中的节点代表数学运算,
    0 码力 | 77 页 | 14.48 MB | 1 年前
    3
  • pdf文档 云计算白皮书

    向下来看,算力资源呈现出计算异构、算网融合的特点。以 GPT-4 为例,其模型训练借助公有云能力在通用 CPU 的基础上整合 上万个 GPU 芯片,通过云计算平台实现 GPU 集群和 CPU 集群的标 准化封装,保障训练任务可以直接下发到大规模计算集群。同时在 数据处理方面,模型训练涉及 PB 级的存储数据集、中间结果和训练 好的模型参数等,且数据类型各异,也需要云计算平台提供的存储 方案,实 网络、存储 资源的操作系统方向演进。 向上来看,数字应用呈现出分布式、多模态、超大量级的特点。 以 ChatGPT 为例,ChatGPT 的模型参数已达千亿,且模型训练数据 涉及文本、图片、音视频等多个模态,基于分布式训练框架实现了 超大规模量级的并行计算,这对部署模型的云计算平台提出新的需 求。云计算的焦点不仅仅在提升单点应用的研运效能,更要发挥出 面向大规模分布式应用协调、分发、部署的中枢管控能力。模型构 样性算力资源池的能力,高性能计算云平台(HPC)、FPGA 云主机、 GPU 云主机、智算平台等多样性算力资源均通过云的方式统一接入, 极大地丰富了科研机构、企业、高校以及个人触达算力的便捷性与 普惠度。同时,东数西算、大模型训练等场景带来了多样性数据, 也催生了可高效满足不同业务诉求的多性化计算架构,如 ARM、 RISC-V 等通用计算技术路线,以及 GPU、DPU、NPU 等融合架构 计算平台,云计算使得不同架构、不同类型算力资源的统一感知、
    0 码力 | 47 页 | 1.22 MB | 1 年前
    3
  • pdf文档 Kubernetes for Edge Computing across Inter-Continental Haier Production Sites

    自开发页面 • Kibana 海尔工业互联网 – 才云数据解决方案 Clever 提交多框架(TensorFlow、PyTorch 、MxNet等)的模型训练作业,支 持分布式和 GPU 加速,以及训练过 程的可视化。 模型训练 模型版本管理,模型推理服务的部署 、监控、管理和升级,提供 A/B test 和滚动升级。 模型服务 实现对 GPU 集群资源进行管理,根 据用户作业请求自动分配和回收
    0 码力 | 33 页 | 4.41 MB | 1 年前
    3
  • pdf文档 深度解析CNCF社区⾸个基于Kubernetes的边缘计算平台KubeEdge

    对监控视频智能分析,实时感知⼊入侵、⼈人流量量⼤大等异常事件,降低园区的⼈人⼒力力成本。� ➔ 端侧⼈人脸抓取,视频分析在边缘侧执⾏行行。云端管理理边缘应⽤用全⽣生命周期,⽆无缝升级。云端AI模型训练,边缘侧推理理。� 端� 边� 云� ⼈人脸 检测 模型� 容器器� ⼈人脸检测� ⼈人流分析� 周界检测� 模型和应⽤用推送、应⽤用管理理、边缘设备托管� ⼈人流 监控 模型� 容器器�
    0 码力 | 20 页 | 2.08 MB | 1 年前
    3
  • pdf文档 Kubernetes全栈容器技术剖析

    图灵生物、蓝鲸传媒、龙渊科技、复华文旅、新奥等。 华为容器服务2015年率先在合营云德电商用,阿里基于K8S的容器服务2017年推出公测,腾讯的容器服务2017年4月上线商用 25 华为云容器训练营开班啦!零基础体验Kubernetes产品! THANK YOU
    0 码力 | 26 页 | 3.29 MB | 1 年前
    3
  • pdf文档 ⾸云容器产品Kubernetes操作指南

    io/docs/tasks/configure-pod-container/attach-handler-lifecycle- event/。 启动执⾏:为容器设置预启动命令和参数。 启动后处理:为容器设置启动后的命令。 停⽌前处理:为容器设置预结束命令。 数据卷:⽀持配置本地存储和云存储。 本地存储:⽀持主机⽬录(hostpath)、配置项(configmap)、保密字典(secret)和临时⽬录四种 io/docs/tasks/configure-pod-container/attach-handler-lifecycle- event/。 启动执⾏:为容器设置预启动命令和参数。 启动后处理:为容器设置启动后的命令。 停⽌前处理:为容器设置预结束命令。 数据卷:⽀持配置本地存储和云存储。 本地存储:⽀持主机⽬录(hostpath)、配置项(configmap)、保密字典(secret)和临时⽬录四种
    0 码力 | 94 页 | 9.98 MB | 1 年前
    3
共 11 条
  • 1
  • 2
前往
页
相关搜索词
运维上海2017机器学习模型训练Kubernetes实践袁晓沛292023技术雷达AlluxioOn车漾范斌GPUJDOSAI结合相结合架构落地解析赵慧智计算白皮皮书白皮书forEdgeComputingacrossInterContinentalHaierProductionSites深度CNCF社区基于边缘平台KubeEdge全栈容器剖析产品操作指南
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩