九九九九九九精品任你躁,亚洲免费精品在线,国产精品久久久久乳精品爆,日韩码有限公司在线观看,婷婷激情在线视频,成人三级在线看

解決方案
運(yùn)用科技進(jìn)行整合性創(chuàng)新
恒聯(lián)云容器平臺

· 云容器平臺使用主流容器編排工具kubernetes搭建容器集群,并提供RBAC控制,容器及服務(wù)的生命周期管理和資源分配;

· 定制化的應(yīng)用商店由Helm提供,可為多用戶提供公開或用戶定制的應(yīng)用快速部署;

· 制化的私有容器鏡像倉庫由Harbor提供,可為多用戶提供研究用戶的容器鏡像;

· 監(jiān)控及日志分析由Prometheus和ELK提供,可實(shí)時(shí)監(jiān)控平臺內(nèi)服務(wù)器、虛擬機(jī)、容器的使用情況;

· 方便結(jié)合CI/CD工具,如Jenkins。提供原廠CI/CD工具Rancher pipline;

· 提供GPU sharing。

DGX加速的數(shù)據(jù)中心
DGX系統(tǒng)支持NVIDIA的AI軟件,包括為DGX優(yōu)化的操作系統(tǒng)(OS dgx),集群管理和業(yè)務(wù)流程工具,可在NGC平臺上下載的庫和深度學(xué)習(xí)框架(為DGX系統(tǒng)優(yōu)化)。
圖1
圖2
推薦說明:
NVIDIA推薦的AI軟件棧建立在針對DGX硬件系統(tǒng)優(yōu)化的OS系統(tǒng),ubuntu操作系統(tǒng)上,包括認(rèn)證的GPU驅(qū)動,網(wǎng)絡(luò)應(yīng)用組合,預(yù)設(shè)的NFS服務(wù)器配置,NVIDIA數(shù)據(jù)中心GPU管理工具(DCGM),支持GPU的docker容器,NVIDIA CUDA® SDK, cuDNN, NCCL和其他NVIDIA加速庫,以及NVLINK/NVswitch技術(shù)。

用戶可自行部署推薦的DGX系統(tǒng)管理應(yīng)用平臺來管理DGX系統(tǒng),該管理應(yīng)用平臺也支持其他服務(wù)器。該平臺是由多個(gè)運(yùn)行在容器中的不同服務(wù)組件組成,示意圖2。
·該管理平臺利用DHCP和PXE技術(shù)實(shí)現(xiàn)DGX OS的網(wǎng)絡(luò)遠(yuǎn)程安裝;
·Ansible可以遠(yuǎn)程實(shí)現(xiàn)分發(fā)應(yīng)用和庫;
·可以 使用kubernetes對容器實(shí)例進(jìn)行管理;
·可使用SLURM對DGX系統(tǒng)提交用戶的作業(yè)任務(wù),并實(shí)現(xiàn)作業(yè)任務(wù)的調(diào)度;
·推薦使用Prometheus為DGX系統(tǒng)做監(jiān)控;
·推薦使用Grafana作為數(shù)據(jù)可視化工具;
·支持資源計(jì)費(fèi)。
產(chǎn)品功能
恒聯(lián)提供豐富的產(chǎn)品功能為用戶解決問題
海量數(shù)據(jù)存儲管理
Massive data storage management
通過分布式文件系統(tǒng),可將海量各類原始數(shù)據(jù)、結(jié)果數(shù)據(jù)進(jìn)行快速存儲,并通過自帶副本機(jī)制,完成對數(shù)據(jù)的多份備份。
靈活多樣數(shù)據(jù)處理引擎
Flexible data processing engine
通過批量計(jì)算、內(nèi)存計(jì)算框架、流式計(jì)算框架、多維數(shù)據(jù)分析計(jì)算、圖計(jì)算等多種技術(shù)支持多種應(yīng)用,計(jì)算引擎實(shí)現(xiàn)“術(shù)業(yè)有專攻”。
海量數(shù)據(jù)快速查詢
Massive data quick query
通過低成本的硬件提供高性能的數(shù)據(jù)加載、索引和查詢,具備對海量數(shù)據(jù)快速查詢響應(yīng)能力。
優(yōu)化的分布式數(shù)據(jù)庫
Optimized distributed database
面向結(jié)構(gòu)化數(shù)據(jù)分析設(shè)計(jì)開發(fā)的,經(jīng)過優(yōu)化的MPP查詢引擎,能夠有效處理PB級別的數(shù)據(jù)量;性能超群TB數(shù)據(jù)秒級返回。
數(shù)據(jù)遷移
data migration
支持關(guān)系型數(shù)據(jù)庫、大數(shù)據(jù)(OLAP)等數(shù)據(jù)源間的數(shù)據(jù)遷移。致力海量數(shù)據(jù)遷移需求下,解決遠(yuǎn)距離、毫秒級異步數(shù)據(jù)傳輸難題;同時(shí)數(shù)據(jù)遷移輕松構(gòu)建安全、可擴(kuò)展、高可用的數(shù)據(jù)傳輸架構(gòu)。
系統(tǒng)高可用性
System high availability
結(jié)合各類分布式軟件架構(gòu)特性,通過引入HA熱備方式,進(jìn)一步提升系統(tǒng)的高可靠和高可用性。
系統(tǒng)運(yùn)維監(jiān)控
System operation and maintenance monitor
系統(tǒng)運(yùn)維監(jiān)控中心提供產(chǎn)品套件的快速安裝部署、集群性能監(jiān)控、組件服務(wù)管理、系統(tǒng)告警分析、主機(jī)管理、版本管理、日志管理等計(jì)算平臺運(yùn)維監(jiān)控服務(wù)。通過統(tǒng)一的圖形化界面實(shí)現(xiàn)對大數(shù)據(jù)平臺運(yùn)行服務(wù)狀況的實(shí)時(shí)監(jiān)控和管理,實(shí)現(xiàn)運(yùn)維的健康化、自動化、智能化,大大降低了人力成本的投入。
資源統(tǒng)一調(diào)配管理
Unified resource management
通過統(tǒng)一的資源調(diào)度技術(shù),可實(shí)現(xiàn)底層硬件資源的共享。將共享的各類計(jì)算資源根據(jù)需要劃分為多個(gè)邏輯運(yùn)行單元,按需動態(tài)分配給不同負(fù)載的應(yīng)用,實(shí)現(xiàn)一個(gè)集群支撐多套不同的應(yīng)用運(yùn)行,在提升集群設(shè)備資源利用率的同時(shí),降低日常運(yùn)維工作量。
數(shù)據(jù)資產(chǎn)
Data asset
基于元數(shù)據(jù)、主數(shù)據(jù)等重要元素,構(gòu)建數(shù)據(jù)資產(chǎn)管理平臺,實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)定義、可視化等管理能力,數(shù)據(jù)安全提供數(shù)據(jù)訪問權(quán)限管理、隱私策略管理、數(shù)據(jù)加解密,依托大數(shù)據(jù)平臺實(shí)現(xiàn)數(shù)據(jù)全生命周期的管理,支持以價(jià)值挖掘?yàn)閷?dǎo)向的數(shù)據(jù)應(yīng)用開發(fā)。
任務(wù)調(diào)度
Task scheduling
擁有先進(jìn)可靠的自動化任務(wù)管理調(diào)度功能,提供可操作的 web 圖形化管理滿足多種場景下各種復(fù)雜的定時(shí)任務(wù)、Cron 任務(wù)調(diào)度和任務(wù)執(zhí)行生命周期管理。有較好的伸縮性和擴(kuò)展性,提供業(yè)務(wù)日志記錄器。支持節(jié)點(diǎn)監(jiān)控、任務(wù)執(zhí)行監(jiān)控,支持暫停/恢復(fù)任務(wù),以及終止運(yùn)行中任務(wù),支持在線配置調(diào)度任務(wù)入?yún)⒑驮诰€查看調(diào)度結(jié)果。提供海量任務(wù)的情況下,嚴(yán)格精確定時(shí)觸發(fā)任務(wù)服務(wù)。
QQ
返回頂部