跳至主要內容
說明文件
技術領域
close
AI 和機器學習
應用程式開發
應用程式託管
運算
資料分析和管道
資料庫
分散式、混合雲和多雲端
生成式 AI
產業解決方案
網路
觀測能力與監控
安全性
Storage
跨產品工具
close
存取權和資源管理
費用和用量管理
Google Cloud SDK、語言、架構和工具
基礎架構即程式碼
遷移
相關網站
close
Google Cloud 首頁
免費試用與免費方案
架構中心
網誌
聯絡銷售人員
Google Cloud Developer Center
Google 開發人員中心
Google Cloud Marketplace
Google Cloud Marketplace 說明文件
Google Cloud Skills Boost
Google Cloud Solution Center
Google Cloud 支援
Google Cloud Tech YouTube 頻道
/
English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어
控制台
登入
Dataproc
指南
參考資料
範例
資源
聯絡我們
免費試用
說明文件
指南
參考資料
範例
資源
技術領域
更多
跨產品工具
更多
相關網站
更多
控制台
聯絡我們
免費試用
Discover
產品總覽
基本概念
元件
總覽
Delta Lake
Docker
Flink
HBase
Hive WebHCat
Hudi
Iceberg
Jupyter
Pig
Presto
Ranger
安裝 Ranger
將 Ranger 與 Kerberos 搭配使用
搭配快取和下修訂範圍使用 Ranger
備份及還原 Ranger 結構定義
Solr
Trino
Zeppelin
Zookeeper
服務
運算選項
機器類型
GPU
最低 CPU 平台
次要工作站
本機固態硬碟
開機磁碟
版本管理
總覽
3.0.x 發布版本
2.3.x 發布版本
2.2.x 發布版本
2.1.x 發布版本
2.0.x 發布版本
叢集映像檔版本清單
常見問題
開始使用
在 Dataproc 上執行 Spark
使用主控台
使用指令列
使用 REST API Explorer
建立叢集
執行 Spark 工作
更新叢集
刪除叢集
使用用戶端程式庫
使用 Kubernetes 執行 Spark
建立
設定專案
使用 Dataproc 範本
建立 Dataproc 叢集
建立叢集
建立高可用性叢集
建立節點群組叢集
建立部分叢集
建立單一節點叢集
建立單一用戶群叢集
重新建立叢集
建立自訂映像檔
建立 Kubernetes 叢集
總覽
發布版本
重新建立叢集
建立節點集區
建立自訂映像檔
在 BigQuery metastore 中建立含有中繼資料的 Apache Iceberg 資料表
開發
Apache Hadoop
Apache HBase
Apache Hive 和 Kafka
Apache Spark
設定
管理 Spark 依附元件
自訂 Spark 環境
啟用並行寫入
提升 Spark 效能
調整 Spark
連結
使用 Spark BigQuery 連接器
使用 Cloud Storage 連接器
使用 Spark Spanner 連接器
執行
使用 HBase
使用蒙地卡羅模擬
使用 Spark ML
使用 Spark Scala
使用 Notebooks
總覽
在 Dataproc 叢集中執行 Jupyter 筆記本
在筆記本上執行基因體分析
使用 JupyterLab 擴充功能開發無伺服器 Spark 工作負載
Python
設定環境
使用 Cloud 用戶端程式庫
Trino
部署
執行工作
工作的生命週期
提交工作
重新啟動工作
查看工作記錄
使用工作流程範本
總覽
參數化
使用 YAML 檔案
使用叢集選取器
使用內嵌工作流程
自動化調度管理工作流程
工作流程排程解決方案
使用 Dataproc 工作流程範本
使用 Cloud Composer
使用 Cloud Functions
使用 Cloud Scheduler
調整效能
提升 Spark 效能
Dataproc 指標
建立指標快訊
剖析資源使用情況
管理
管理叢集
啟動及停止叢集
手動啟動及停止叢集
排定叢集停止運作時間
更新及刪除叢集
輪替叢集
設定叢集
設定叢集屬性
選取區域
自動選取區域
定義初始化動作
將 VM 類型設為優先順序
排定刪除叢集
調度叢集
調度叢集
自動調度叢集資源
管理資料
Hadoop 資料儲存空間
選取儲存空間類型
快取叢集資料
卸載重組資料
管理網路
設定網路
透過 Private Service Connect 建立 Dataproc 叢集網路
管理 Kubernetes 叢集
調度叢集
刪除叢集
存取叢集
使用 SSH
連線至網路介面
使用元件閘道
設定人力資源存取權
管理中繼資料和標籤
啟用 Spark 資料系譜