文章 2025-02-02 来自:开发者社区

DeepSeek背后的技术基石:DeepSeekMoE基于专家混合系统的大规模语言模型架构

DeepSeekMoE是一种创新的大规模语言模型架构,通过整合专家混合系统(Mixture of Experts, MoE)、改进的注意力机制和优化的归一化策略,在模型效率与计算能力之间实现了新的平衡。 DeepSeekMoE架构融合了专家混合系统(MoE)、多头潜在注意力机制(Multi-Head Latent Attention, MLA)和RMSNorm三个核心组件。通过专家共享机制、动.....

DeepSeek背后的技术基石:DeepSeekMoE基于专家混合系统的大规模语言模型架构
文章 2025-01-24 来自:开发者社区

社交软件红包技术解密(六):微信红包系统的存储层架构演进实践

本文为CSDN的《程序员》杂志原创文章,下文有修订和改动”。 1、引言 南方企业一直有过年找老板“逗利是”的习俗,每年春节后开工的第一天,腾讯大厦都会排上长长的队伍,集体上楼找老板们领红包。按照广东习俗,已经结婚的同事也要给未婚同事发红包,这一天腾讯员工就在春茗和寻找红包中度过。 由此孵化了一个内部项目,通过微信来收发红包,把这个公司全员娱乐活动与最活跃的IM平...

社交软件红包技术解密(六):微信红包系统的存储层架构演进实践
阿里云文档 2024-07-15

GPU容器共享技术cGPU

GPU容器共享技术cGPU是阿里云基于内核虚拟GPU隔离的容器共享技术。即多个容器共享一张GPU卡,从而实现业务的安全隔离,提高GPU硬件资源的利用率并降低使用成本。

问答 2024-05-16 来自:开发者社区

在阿里巴巴集团的客服技术商业化过程中,工单系统是什么架构?

在阿里巴巴集团的客服技术商业化过程中,工单系统是什么架构?

文章 2023-12-19 来自:开发者社区

【云计算与大数据技术】大数据系统总体架构概述(Hadoop+MapReduce )

一、总体架构设计原则企业级大数据应用框架需要满足业务的需求,一是要求能够满足基于数据容量大,数据类型多,数据流通快的大数据基本处理需求,能够支持大数据的采集,存储,处理和分析,二是要能够满足企业级应用在可用性,可靠性,可扩展性,容错性,安全性和隐私性等方面的基本准则,三是要能够满足用原始技术和格式来实现数据分析的基本要求满足大数据的V3要求  大数据容量的加载、处理和分析 - 要求大数....

【云计算与大数据技术】大数据系统总体架构概述(Hadoop+MapReduce )
阿里云文档 2023-07-26

产品白皮书SOFAStack关键技术竞争力是什么

传统应用现代化:不止于异构应用治理在传统单体式架构向微服务架构迁移的过程中,随着应用微服务数量的增加,微服务间的通信、监控以及安全性管理成为新的挑战。服务网格作为应用与基础设施的桥梁,突破传统的 SDK 接入方式,以对应用透明的方式处理服务之间、服务与基础设施间的通信,实现应用研发和基础设施最大程度...

文章 2022-06-13 来自:开发者社区

视频直播技术干货:一文读懂主流视频直播系统的推拉流架构、传输协议等

本文由蘑菇街前端开发工程师“三体”分享,原题“蘑菇街云端直播探索——启航篇”,有修订。1、引言随着移动网络网速的提升与资费的降低,视频直播作为一个新的娱乐方式已经被越来越多的用户逐渐接受。特别是最近这几年,视频直播已经不仅仅被运用在传统的秀场、游戏类板块,更是作为电商的一种新模式得到迅速成长。本文将通过介绍实时视频直播技术体系,包括常用的推拉流架构、传输协议等,让你对现今主流的视频直播技术有一个....

视频直播技术干货:一文读懂主流视频直播系统的推拉流架构、传输协议等

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

金融级分布式架构

SOFAStack™(Scalable Open Financial Architecture Stack)是一套用于快速构建金融级分布式架构的中间件,也是在金融场景里锤炼出来的最佳实践。

+关注