并行文件存储在大模型训练中的探索与实践
由阿里云智能集团存储产品专家何邦剑先生分享并行文件存储在大模型训练中的探索与实践。 一、大模型训练的io特点 了解cps在大模型训练当中做了哪些创新或者实践。训练一个大模型需要考虑整个平台,考虑网络考虑存储。在计算方面,需要去看到规模不断扩大的情况下计算的故障率,包括计算架构的稳定性都是需要考虑的。 对于网络,可能需要去考虑考虑网络的延时,...
分布式文件存储与数据缓存 Redis高可用分布式实践(下)(四)
11.7 哨兵监控故障转移监控演示故障转移 #查看主节点所在端口6379进程的PID [root@localhost src]# lsof -i:6379 #杀死主节点的redis服务模拟故障 [root@localhost src]# kill -9 PID查看哨兵节点信息[root@localhost src]# ./redis-cli -p 26379 127.0.0.1:26379&...

分布式文件存储与数据缓存 Redis高可用分布式实践(下)(三)
十、Redis事务10.1 事务概念与ACID特性数据库层面事务在数据库层面,事务是指一组操作,这些操作要么全都被成功执行,要么全都不执行。数据库事务的四大特性A:Atomic,原子性,将所有SQL作为原子工作单元执行,要么全部执行,要么全部不执行;C:Consistent,一致性,事务完成后,所有数据的状态都是一致的,即A账户只要减去了100,B账户则必定加上了100;I:Isolation,....

分布式文件存储与数据缓存 Redis高可用分布式实践(下)(二)
八、Redis其他功能8.1 发布订阅什么是发布与订阅Redis 发布订阅 (pub/sub) 是一种消息通信模式:发送者 (pub) 发送消息,订阅者 (sub) 接收消息。什么时候用发布订阅看到发布订阅的特性,用来做一个简单的实时聊天系统再适合不过了。再比如,在一个博客网站中,有100个粉丝订阅了你,当你发布新文章,就可以推送消息给粉丝们拉。Redis的发布与订阅 发布订阅命令行实现订阅su....

分布式文件存储与数据缓存 Redis高可用分布式实践(下)(一)
六、Redisweb实践 网页缓存 1.创建springboot项目2.选择组件Lombokspring mvcspring data redisspring data jpa3.编写配置文件### 数据库访问配置 spring.datasource.driver-class-name=com.mysql.jdbc.Driver spring.datasource.url=jdbc:....

分布式文件存储与数据缓存 Redis高可用分布式实践(上)(四)
四、Redis可视化工具:Redis Destktop Manager(带时间) 4.1 下载Redis Desktop Manager官网RESP.app (formerly Redis Desktop Manager) - GUI for Redis ® available on Windows, macOS, iPad and Linux. 或者使用文章配套的安装包。4.2 连接Redis....

分布式文件存储与数据缓存 Redis高可用分布式实践(上)(三)
3.4 Set类型简介与List类似是一个列表功能,但Set是自动排重的,当需要存储一个列表数据,又不希望出现重复数据时,Set是一个很好的选择。Set是String类型的无序集合,它底层其实是一个value为null的hash表,所以添加、删除、查找的时间复杂度都是O(1)。sadd将一个或多个元素添加到集合key中,已经存在的元素将被忽略。sadd key value1 value2……示例....

分布式文件存储与数据缓存 Redis高可用分布式实践(上)(二)
二、Redis安装2.1 Linux下安装Redis下载地址Redis官方网址:Redis下载Redis安装包源文件 鼠标右键选择复制连接地址,在linux下使用wget下载安装包(或者直接下载到win,再上传到Linux)wget https://github.com/redis/redis/archive/6.2.6.tar.gz 将安装包解压到/usr/local目录下安装C语言编译环境G....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。