我在 hive 中有一张桌子,包括

questionid,questiontag,answerID,userIDofanswerer
我需要此数据集中的十大最常用标签。
我试过了 :
select count(questionID),questiontag from table GROUP BY tags;
但是我如何通过Count(questionID)订购

最佳答案

ORDER BY cnt DESC LIMIT 10下面的查询中,将选择前10个最常用的标签:

    SELECT count(questionID) cnt ,
           questiontag
      FROM table
  GROUP BY questiontag
  ORDER BY cnt DESC
  LIMIT 10;
count(*)将计算包括NULL QuestionID在内的所有行
count(questionID)将仅对问题ID不为NULL的行进行计数

关于hadoop - 在 hive mapreduce中计算desc,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39753845/

10-11 21:38