400-650-7353
您所在的位置:首頁 > IT就業(yè)指南 > 面試題 > 【大數(shù)據(jù)面試題】10道常見的大數(shù)據(jù)面試題(四)

【大數(shù)據(jù)面試題】10道常見的大數(shù)據(jù)面試題(四)

  • 來源:互聯(lián)網(wǎng)
  • 2018-11-12 15:25:27
  • 閱讀()
  • 分享
  • 手機端入口

近年來大數(shù)據(jù)技術(shù)人才層出不窮,但無論如何求職者只有經(jīng)過層層面試才能獲得施展才華的機會,而面試的首關(guān)就是一套技術(shù)面試題,所以中公優(yōu)就業(yè)小編整理了一些常見的大數(shù)據(jù)面試題,希望對大家有幫助。

1、舉一個簡單的例子說明mapreduce是怎么來運行的 ?

2、secondarynamenode的主要職責(zé)是什么?簡述其工作機制

3、Sqoop用起來感覺怎樣?

4、kafka 數(shù)據(jù)高可用的原理是什么

5、MapReduce 中排序發(fā)生在哪幾個階段?這些排序是否可以避免?為什么?

【大數(shù)據(jù)面試題】10道常見的大數(shù)據(jù)面試題(四)

6、100w 個數(shù)中找出最大的 100 個數(shù)。

7、一個文本文件,大約有一萬行,每行一個詞,要求統(tǒng)計出其中最頻繁出現(xiàn)的前10個詞,請給出思想,給出時間復(fù)雜度分析。

8、已知某個文件內(nèi)包含一些電話號碼,每個號碼為8位數(shù)字,統(tǒng)計不同號碼的個數(shù)。

9、有一千萬條短信,有重復(fù),以文本文件的形式保存,一行一條,有重復(fù)。 請用 5 分鐘時間,找出重復(fù)出現(xiàn)最多的前 10 條。

10、每個文件至少有1000萬行,請用程序完成以下工作,

1)每個文件的個子的IP

2)出現(xiàn)在b.text而沒有出現(xiàn)在a.text的IP

3)每個user出現(xiàn)的次數(shù)以及每個user對應(yīng)的IP的個數(shù)

相關(guān)推薦:

【大數(shù)據(jù)面試題】10道常見的大數(shù)據(jù)面試題(三)

【大數(shù)據(jù)培訓(xùn)教程】把握時代風(fēng)口,做大數(shù)據(jù)架構(gòu)師

文章“【大數(shù)據(jù)面試題】10道常見的大數(shù)據(jù)面試題(四)”已幫助

更多內(nèi)容

>>本文地址:http://m.littlerockbway.com/jiuye/2018/45570.html

THE END  

聲明:本站稿件版權(quán)均屬中公教育優(yōu)就業(yè)所有,未經(jīng)許可不得擅自轉(zhuǎn)載。

1 您的年齡

2 您的學(xué)歷

3 您更想做哪個方向的工作?

獲取測試結(jié)果
  • 大前端大前端
  • 大數(shù)據(jù)大數(shù)據(jù)
  • 互聯(lián)網(wǎng)營銷互聯(lián)網(wǎng)營銷
  • JavaJava
  • Linux云計算Linux
  • Python+人工智能Python
  • 嵌入式物聯(lián)網(wǎng)嵌入式
  • 全域電商運營全域電商運營
  • 軟件測試軟件測試
  • 室內(nèi)設(shè)計室內(nèi)設(shè)計
  • 平面設(shè)計平面設(shè)計
  • 電商設(shè)計電商設(shè)計
  • 網(wǎng)頁設(shè)計網(wǎng)頁設(shè)計
  • 全鏈路UI/UE設(shè)計UI設(shè)計
  • VR/AR游戲開發(fā)VR/AR
  • 網(wǎng)絡(luò)安全網(wǎng)絡(luò)安全
  • 新媒體與短視頻運營新媒體
  • 直播帶貨直播帶貨
  • 智能機器人軟件開發(fā)智能機器人
 

快速通道fast track

近期開班時間TIME