IT培訓(xùn)網(wǎng)
IT在線學(xué)習(xí)
大數(shù)據(jù)工作者應(yīng)聘時,面試是一道躲不過的檻,所以優(yōu)就業(yè)小編收集了一些2018常見的大數(shù)據(jù)面試題,希望可以幫到準(zhǔn)備或者正在參加大數(shù)據(jù)面試的朋友們。
1、下列哪個程序通常與 NameNode 在一個節(jié)點啟動?
a)SecondaryNameNode
b)DataNode
c)TaskTracker
d)Jobtracke
2、下列哪項通常是集群的最主要瓶頸:
a)CPU
b)網(wǎng)絡(luò)
c)磁盤IO
d)內(nèi)存
3、下列哪項可以作為集群的管理?
a)Puppet
b)Pdsh
c)Cloudera Manager
d)Zookeeper
4、Cloudera 提供哪幾種安裝 CDH 的方法?
a)Cloudera manager
b)Tarball
c)Yum
d)Rpm
5、下面哪個程序負(fù)責(zé) HDFS 數(shù)據(jù)存儲。
a)NameNode
b)Jobtracker
c)Datanode
d)secondaryNameNode
e)tasktracker
6、一個Hadoop環(huán)境,整合了HBase和Hive,是否有必要給HDFS和Hbase都分別配置壓縮策略?請給出對壓縮策略的建議。
7、如果要存儲海量的小文件(大小都是幾百K~幾M),請簡述自己的設(shè)計方案。
8、kafka topic為什么設(shè)定8個分區(qū)?
9、為什么要在hbase中創(chuàng)建一個元數(shù)據(jù)表保存每個表的字段和主鍵,刪除的時候要查一遍而那upsert的時候也要有主鍵,為什么不用?
10、有大量的英文文獻(xiàn),需要進(jìn)行統(tǒng)計
1;統(tǒng)計出現(xiàn)次數(shù)前一百的所有單詞
2:統(tǒng)計出現(xiàn)次數(shù)為10-20次,20-30次的所有單詞。
相關(guān)推薦:
更多內(nèi)容
>>本文地址:http://m.littlerockbway.com/jiuye/2018/45451.html
聲明:本站稿件版權(quán)均屬中公教育優(yōu)就業(yè)所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
1 您的年齡
2 您的學(xué)歷
3 您更想做哪個方向的工作?