文章 2025-03-19 来自:开发者社区

新闻聚合项目:多源异构数据的采集与存储架构

论点 在传统认知中,数据采集似乎只是一门简单的数据抓取技术——“只要能拿到数据,一切问题迎刃而解”。然而,事实远比这复杂:在新闻聚合项目中,多源异构数据的清洗与存储架构往往决定了项目的成败。仅靠单纯的抓取技术不仅容易遭遇网站封禁,还可能因数据混杂、格式不统一而导致后续处理困难。因此,提出一个论点:数据清洗、智能存储与代理IP等辅助技术,才是真正赋能新闻聚合项目的核心竞争力。 正反双方论据 正方观....

新闻聚合项目:多源异构数据的采集与存储架构
阿里云文档 2023-07-26

如何安装日志采集客户端

日志采集客户端 Logtail 可通过运维脚本批量安装或手动安装。

文章 2023-06-02 来自:开发者社区

带你读《云存储应用白皮书》之32:5. 日志采集在微服务架构中的应用

5. 日志采集在微服务架构中的应用 1)需求背景 容器技术在微服务落地过程中的部署、交付等环节给用户带来了越来越多的便捷,同时也会存在容器化应用/非容器化应用混合部署的情况,并且Kubernetes作为容器编排领域的领导者,正朝着PaaS底座标配方向发展。 阿里云日志服务(SLS)结合阿里云容器服务Kubernetes版(ACK)等云产品为以阿里云公共云产品为基础构....

带你读《云存储应用白皮书》之32:5. 日志采集在微服务架构中的应用
文章 2022-10-20 来自:开发者社区

PostgreSQL11 CDC的分布式文件采集架构实战

PostgreSQL Wal2json的变更捕获通过CDC(数据变更捕获)机制将PostgreSQL主表变更数据以PG逻辑复制机制迁移到异构的数据库中。先看我们的PG CDC方案:PG逻辑复制经历Wal2json解码,由pg_recvlogical监控源源不断输出到文件,然后由Storm的自定义Java程序监测文件(后续聊如何监测),并分流到Kafka Topic,来实现变更数据捕获(CDC)方....

PostgreSQL11 CDC的分布式文件采集架构实战
文章 2022-08-25 来自:开发者社区

一文搞懂 SAE 日志采集架构

作者:牛通(奇卫)日志,对于一个程序的重要程度不言而喻。无论是作为排查问题的手段,记录关键节点信息,或者是预警,配置监控大盘等等,都扮演着至关重要的角色。是每一类,甚至每一个应用程序都需要记录和查看的重要内容。而在云原生时代,日志采集无论是在采集方案,还是在采集架构上,都会和传统的日志采集有一些差异。我们汇总了一下在日志的采集过程中,经常会遇到一些实际的通用问题,例如:部署在 K8s 的应用,磁....

一文搞懂 SAE 日志采集架构
文章 2022-08-24 来自:开发者社区

一文搞懂 SAE 日志采集架构

日志,对于一个程序的重要程度不言而喻。无论是作为排查问题的手段,记录关键节点信息,或者是预警,配置监控大盘等等,都扮演着至关重要的角色。是每一类,甚至每一个应用程序都需要记录和查看的重要内容。而在云原生时代,日志采集无论是在采集方案,还是在采集架构上,都会和传统的日志采集有一些差异。我们汇总了一下在日志的采集过程中,经常会遇到一些实际的通用问题,例如:部署在 K8s 的应用,磁盘大小会远远低于物....

一文搞懂 SAE 日志采集架构
文章 2022-06-13 来自:开发者社区

基于Golang的云原生日志采集服务架构与实践

-     背景    -云原生技术大潮已经来临,技术变革迫在眉睫。在这股技术潮流之中,网易推出了轻舟微服务云平台,集成了微服务、Servicemesh、容器云、DevOps等,已经广泛应用于公司集团内部,同时也支撑了很多外部客户的云原生化改造和迁移。在这其中,日志是平时很容易被人忽视的一部分,却是微服务、DevOps的重要一环。没有日志,服务问题排查无从....

基于Golang的云原生日志采集服务架构与实践
问答 2022-03-30 来自:开发者社区

通过云速搭部署 SLS 实现日志采集处理分析的方案架构是什么样的?

通过云速搭部署 SLS 实现日志采集处理分析的方案架构是什么样的?

文章 2022-02-16 来自:开发者社区

果断收藏!六大主流大数据采集平台架构分析

随着大数据越来越被重视,数据采集的挑战变的尤为突出。今天为大家介绍几款数据采集平台: Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder 大数据平台与数据采集 任何完整的大数据平台,一般包括以下的几个过程: 数据采集–>数据存储–>数据处理–>数据展现(可视化,报表和监控) 其中,数据采集是所有数据系统必不.....

果断收藏!六大主流大数据采集平台架构分析
文章 2022-02-16 来自:开发者社区

关于大数据采集平台架构分析的简述

随着大数据越来越被重视,数据采集的挑战变的尤为突出。今天为大家介绍几款数据采集平台: Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder 大数据平台与数据采集 任何完整的大数据平台,一般包括以下的几个过程: 数据采集 数据存储 数据处理 数据展现(可视化,报表和监控) 其中,数据采集是所有数据系统必不可少的,随着大数...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

金融级分布式架构

SOFAStack™(Scalable Open Financial Architecture Stack)是一套用于快速构建金融级分布式架构的中间件,也是在金融场景里锤炼出来的最佳实践。

+关注