Hive Database Tutorial

About 29,500 results

Open links in new tab

Any time

zhihu.com
https://www.zhihu.com › question
大数据之hadoop / hive / hbase 的区别是什么？有什么应用场景？
2. Hive Hive是一个基于Hadoop的数据仓库系统，它将SQL语言转化为MapReduce任务，并在Hadoop集群上运行。它提供了类似于SQL的查询和分析接口，使得非专业开发人员可以通过 …
zhihu.com
https://www.zhihu.com › question
HBase 和 Hive 的差别是什么，各自适用在什么场景中？ - 知乎
1. Hive中的表是纯逻辑表，就只是表的定义等，即表的元数据。 Hive本身不存储数据，它完全依赖HDFS和MapReduce。这样就可以将结构化的数据文件映射为为一张数据库表，并提供完整 …
zhihu.com
https://www.zhihu.com › question
如何通俗地理解Hive的工作原理？ - 知乎
接下去Hive会对执行计划进行优化，最常见的优化可能是PartitionPrune，比如你在Hive中定义了分区表，那么如果有Where条件中出现了分区字段，比如WHERE date ＝ '2016-08-25'，而且分 …
zhihu.com
https://www.zhihu.com › question
为什么Hive正在被淘汰？ - 知乎
总的来说，Hive on Tez 保留了与 Hadoop 的紧密集成，可在 YARN 环境下执行，但相比 MapReduce 查询响应时延显著降低，吞吐量得到提升。 Hive + LLAP Hive 3.x 版本引入了 …
zhihu.com
https://www.zhihu.com › question
pyspark 如何读取大数据平台中的 hive 数据表？ - 知乎
比如我们指定使用MySQL作为Hive元数据的存储介质，那么就需要把Hive连接MySQL的相关属性配置在hive-site.xml文件中，这样不管是本地模式还是远程模式启动，不管客户端本地连接还 …
zhihu.com
https://www.zhihu.com › question
请问spark和hive是什么关系？ - 知乎
再来看看hive。 hive 官网有描述，“Apache Hive data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQL.”，hive的定位 …
zhihu.com
https://www.zhihu.com › question
hive 如何优化查询速度？ - 知乎
Hive 优化查询速度的方法有很多，你可以记下：使用分区表和分桶表：合理的分区和分桶可以大大减少查询数据量，提高查询效率。避免使用 select *：尽量只选择需要的列，避免查询不必 …
zhihu.com
https://www.zhihu.com › question
请问Hadoop、Hbase、Hive三者有什么关系？ - 知乎
hive需要用到hdfs存储文件，需要用到MapReduce计算框架。 HBase：是一个Hadoop的数据库，一个分布式、可扩展、大数据的存储。
zhihu.com
https://www.zhihu.com › question
没去过大公司如何学hive? - 知乎
hive的元数据存储在关系数据库里，支持derby、mysql两种关系型数据库。元数据对于hive十分重要，因此Hive支持把metastore服务独立出来，安装到远程的服务器集群里，从而解耦hive服 …
zhihu.com
https://www.zhihu.com › question
一条Hive SQL作业执行慢，该怎么办？ - 知乎
最近笔者在某客户线上生产环境就频繁多次遇到了该问题，某些HIVE SQL 作业（底层非HIVE ACID事务表），因为迟迟获取不到HIVE锁导致作业长时间卡死，最后运维人员不得不登 …

Some results have been removed
Pagination
- 1
- 2
- 3
- Next