沒(méi)有計(jì)算機(jī)基礎(chǔ)應(yīng)該如何學(xué)習(xí)大數(shù)據(jù)知識(shí)?
學(xué)習(xí)程序開發(fā)可以在一些開源平臺(tái)上瀏覽更多的項(xiàng)目、博客、問(wèn)答。知名平臺(tái)如github,stackoverflow。
在github上搜索大數(shù)據(jù),會(huì)出現(xiàn)相關(guān)項(xiàng)目。有大數(shù)據(jù)入門指南的項(xiàng)目挺好的,可以借鑒一下。地址:如果限制訪問(wèn),可以點(diǎn)贊評(píng)論。
以下是取自項(xiàng)目的插圖和章節(jié)導(dǎo)航。
附:項(xiàng)目相關(guān)知識(shí)點(diǎn)如下
序
大數(shù)據(jù)學(xué)習(xí)路線
大數(shù)據(jù)技術(shù)堆棧思維導(dǎo)圖
大數(shù)據(jù)常用軟件安裝指南
首先,Hadoop
分布式文件存儲(chǔ)系統(tǒng)-HDFS
MapReduce,一個(gè)分布式計(jì)算框架
集群資源管理器-yarn
Hadoop單機(jī)偽集群環(huán)境的構(gòu)建
Hadoop集群環(huán)境構(gòu)建
HDFS通用Shell命令
HDFSJavaAPI的使用
基于Zookeeper構(gòu)建Hadoop高可用性集群
第二,蜂巢
Hive簡(jiǎn)介和核心概念
Linux環(huán)境下Hive的安裝和部署
HiveCLI和B:
Spark簡(jiǎn)介
星火開發(fā)環(huán)境建設(shè)
彈性數(shù)據(jù)集RDD
RDD常用運(yùn)算符詳解
Spark操作模式和作業(yè)提交
火花累加器和廣播變量
基于Zook:
數(shù)據(jù)框架和數(shù)據(jù)集
結(jié)構(gòu)化API的基本用法
SparkSQL外部數(shù)據(jù)源
SparkSQL的常用聚合函數(shù)
SparkSQL連接操作
火花流:
火花流簡(jiǎn)介
火花流基本操作
火花流動(dòng)集成水槽
火花流式集成卡夫卡
第四,風(fēng)暴
暴雨和河流處理簡(jiǎn)介
風(fēng)暴核心概念詳解
風(fēng)暴單機(jī)環(huán)境建設(shè)
風(fēng)暴集群環(huán)境建設(shè)
風(fēng)暴規(guī)劃模型詳解
風(fēng)暴工程三種包裝的對(duì)比分析
暴風(fēng)集成Redis詳解
風(fēng)暴集成HDFS/Hbase
風(fēng)暴集成卡夫卡
動(dòng)詞(verb的縮寫)弗林克
Flink核心概念概述
Flink開發(fā)環(huán)境建設(shè)
Flink數(shù)據(jù)源
Flink數(shù)據(jù)轉(zhuǎn)換
Flink數(shù)據(jù)接收器
Flink窗口模型
Flink狀態(tài)管理和檢查點(diǎn)機(jī)制
Flink獨(dú)立集群部署
第六,Hbase
Hbase簡(jiǎn)介
Hbase系統(tǒng)架構(gòu)和數(shù)據(jù)結(jié)構(gòu)
h基本環(huán)境構(gòu)建(獨(dú)立/偽分布式模式)
Hbase集群環(huán)境的構(gòu)建
Hbase常見(jiàn)Shell命令
HbaseJavaAPI
Hbase過(guò)濾器的詳細(xì)說(shuō)明
Hbase協(xié)處理器的詳細(xì)說(shuō)明
h基本災(zāi)難恢復(fù)和備份
Phoenix,Hbase的SQL中間層
春天/SpringBoot整合Mybatis鳳凰
七、卡夫卡
卡夫卡簡(jiǎn)介
基于Zookeeper構(gòu)建Kafka高可用性集群
卡夫卡制作人詳解
卡夫卡消費(fèi)者詳解
深刻理解卡夫卡的復(fù)制機(jī)制
八,動(dòng)物園管理員
Zookeeper簡(jiǎn)介和核心概念
Zookeeper單機(jī)環(huán)境和集群環(huán)境構(gòu)建
Zookeeper常見(jiàn)Shell命令
ZookeeperJava客戶端-Apache管理員
動(dòng)物園管理員ACL訪問(wèn)控制
九、水槽
水槽的簡(jiǎn)介和基本用途
Linux環(huán)境下Flume的安裝和部署
水槽整合卡夫卡
X.Sqoop
Sqoop的介紹和安裝
Sqoop的基本用法
Xi。阿茲卡班
阿茲卡班簡(jiǎn)介
Azkaban3.x的編譯和部署
阿茲卡班流程1.0的使用
阿茲卡班流程2.0的使用
十二。斯卡拉
Scala介紹及開發(fā)環(huán)境配置
基本數(shù)據(jù)類型和運(yùn)算符
過(guò)程控制語(yǔ)句
陣列-陣列
器械包類型匯總
列表集,常用的集合類型之一
常見(jiàn)的集合類型之一——maptuple
班級(jí)
繼承和特點(diǎn)
函數(shù)閉包的cori化
模式匹配
類型參數(shù)
隱式轉(zhuǎn)換和隱式參數(shù)
十三。公共內(nèi)容
大數(shù)據(jù)應(yīng)用程序的常見(jiàn)打包方法
附言
推薦數(shù)據(jù)共享和開發(fā)工具
自學(xué)大數(shù)據(jù),能找到工作嗎?簡(jiǎn)歷該如何寫?
謝謝你邀請(qǐng)我!
自學(xué)大數(shù)據(jù)沒(méi)問(wèn)題,能不?找工作要看你掌握的技能是否能滿足企業(yè)的崗位要求。至于簡(jiǎn)歷,你要清晰的呈現(xiàn)你的知識(shí)結(jié)構(gòu)和項(xiàng)目經(jīng)歷。
對(duì)于自學(xué)大數(shù)據(jù)的工程師來(lái)說(shuō),簡(jiǎn)歷中要突出以下幾個(gè)方面:
首先,描述具體職位的知識(shí)結(jié)構(gòu)。大數(shù)據(jù)相關(guān)工作包括大數(shù)據(jù)平臺(tái)研發(fā)、大數(shù)據(jù)應(yīng)用開發(fā)、大數(shù)據(jù)分析和大數(shù)據(jù)運(yùn)維等。每個(gè)崗位需要的知識(shí)結(jié)構(gòu)不一樣,要有針對(duì)性的描述。記得在簡(jiǎn)歷上做個(gè)大概描述,重點(diǎn)突出。
第二,注意實(shí)用環(huán)節(jié)的描述。對(duì)于大數(shù)據(jù)領(lǐng)域的工程師來(lái)說(shuō),實(shí)踐能力是企業(yè)最關(guān)注的能力之一,所以需要把學(xué)習(xí)過(guò)程中涉及的實(shí)踐環(huán)節(jié)講清楚。以大數(shù)據(jù)分析為例,如何做數(shù)據(jù)分析是企業(yè)最關(guān)心的內(nèi)容,包括具體的方法,比如數(shù)據(jù)分析能否由機(jī)器學(xué)習(xí)來(lái)完成就是考察的重點(diǎn)內(nèi)容。
第三,注意基礎(chǔ)知識(shí)的描述。對(duì)于自學(xué)者來(lái)說(shuō),大數(shù)據(jù)的很多行業(yè)實(shí)踐可能并不了解,包括數(shù)據(jù)的收集、整理、存儲(chǔ)、安全等方法。如果在這些環(huán)節(jié)做過(guò)多的描述,就會(huì)偏離正常的軌道。盡量避免陷入這些環(huán)節(jié),突出自己的基礎(chǔ)知識(shí)結(jié)構(gòu)。基礎(chǔ)知識(shí)對(duì)于一個(gè)大數(shù)據(jù)工程師來(lái)說(shuō)非常重要,一定要強(qiáng)調(diào)。
第四,注意學(xué)習(xí)能力的描述。對(duì)于大數(shù)據(jù)工程師來(lái)說(shuō),學(xué)習(xí)能力很重要。對(duì)于自學(xué)者來(lái)說(shuō),能夠掌握一定的大數(shù)據(jù)知識(shí)本身就證明了他們的自學(xué)能力。尤其是初級(jí)大數(shù)據(jù)崗位,面試官可能更看重者的學(xué)習(xí)能力,所以需要重點(diǎn)考察學(xué)習(xí)大數(shù)據(jù)的過(guò)程、計(jì)劃和經(jīng)驗(yàn),這些往往能決定面試的結(jié)果。
人工智能和大數(shù)據(jù)是我的主要研究方向。目前也在考相關(guān)方向的研究生。我會(huì)陸續(xù)在頭條寫一些關(guān)于人工智能的文章。有興趣的朋友可以關(guān)注我,相信我會(huì)有所收獲。
如果你有任何上網(wǎng)問(wèn)題,也可以咨詢我,謝謝!
