跳至主要內容
Google Cloud
說明文件 技術領域
  • AI 和機器學習
  • 應用程式開發
  • 應用程式託管
  • 運算
  • 資料分析和管道
  • 資料庫
  • 分散式、混合雲和多雲端
  • 生成式 AI
  • 產業解決方案
  • 網路
  • 觀測能力與監控
  • 安全性
  • Storage
跨產品工具
  • 存取權和資源管理
  • 費用和用量管理
  • Google Cloud SDK、語言、架構和工具
  • 基礎架構即程式碼
  • 遷移
相關網站
  • Google Cloud 首頁
  • 免費試用與免費方案
  • 架構中心
  • 網誌
  • 聯絡銷售人員
  • Google Cloud Developer Center
  • Google 開發人員中心
  • Google Cloud Marketplace
  • Google Cloud Marketplace 說明文件
  • Google Cloud Skills Boost
  • Google Cloud Solution Center
  • Google Cloud 支援
  • Google Cloud Tech YouTube 頻道
/
  • English
  • Deutsch
  • Español
  • Español – América Latina
  • Français
  • Indonesia
  • Italiano
  • Português
  • Português – Brasil
  • 中文 – 简体
  • 中文 – 繁體
  • 日本語
  • 한국어
控制台 登入
  • Dataproc
指南 參考資料 範例 資源
聯絡我們 免費試用
Google Cloud
  • 說明文件
    • 指南
    • 參考資料
    • 範例
    • 資源
  • 技術領域
    • 更多
  • 跨產品工具
    • 更多
  • 相關網站
    • 更多
  • 控制台
  • 聯絡我們
  • 免費試用
  • Discover
  • 產品總覽
  • 基本概念
  • 元件
    • 總覽
    • Delta Lake
    • Docker
    • Flink
    • HBase
    • Hive WebHCat
    • Hudi
    • Iceberg
    • Jupyter
    • Pig
    • Presto
    • Ranger
      • 安裝 Ranger
      • 將 Ranger 與 Kerberos 搭配使用
      • 搭配快取和下修訂範圍使用 Ranger
      • 備份及還原 Ranger 結構定義
    • Solr
    • Trino
    • Zeppelin
    • Zookeeper
  • 服務
  • 運算選項
    • 機器類型
    • GPU
    • 最低 CPU 平台
    • 次要工作站
    • 本機固態硬碟
    • 開機磁碟
  • 版本管理
    • 總覽
    • 3.0.x 發布版本
    • 2.3.x 發布版本
    • 2.2.x 發布版本
    • 2.1.x 發布版本
    • 2.0.x 發布版本
    • 叢集映像檔版本清單
  • 常見問題
  • 開始使用
  • 在 Dataproc 上執行 Spark
    • 使用主控台
    • 使用指令列
    • 使用 REST API Explorer
      • 建立叢集
      • 執行 Spark 工作
      • 更新叢集
      • 刪除叢集
    • 使用用戶端程式庫
    • 使用 Kubernetes 執行 Spark
  • 建立
  • 設定專案
  • 使用 Dataproc 範本
  • 建立 Dataproc 叢集
    • 建立叢集
    • 建立高可用性叢集
    • 建立節點群組叢集
    • 建立部分叢集
    • 建立單一節點叢集
    • 建立單一用戶群叢集
    • 重新建立叢集
    • 建立自訂映像檔
  • 建立 Kubernetes 叢集
    • 總覽
    • 發布版本
    • 重新建立叢集
    • 建立節點集區
    • 建立自訂映像檔
  • 在 BigQuery metastore 中建立含有中繼資料的 Apache Iceberg 資料表
  • 開發
  • Apache Hadoop
  • Apache HBase
  • Apache Hive 和 Kafka
  • Apache Spark
    • 設定
      • 管理 Spark 依附元件
      • 自訂 Spark 環境
      • 啟用並行寫入
      • 提升 Spark 效能
      • 調整 Spark
    • 連結
      • 使用 Spark BigQuery 連接器
      • 使用 Cloud Storage 連接器
      • 使用 Spark Spanner 連接器
    • 執行
      • 使用 HBase
      • 使用蒙地卡羅模擬
      • 使用 Spark ML
      • 使用 Spark Scala
  • 使用 Notebooks
    • 總覽
    • 在 Dataproc 叢集中執行 Jupyter 筆記本
    • 在筆記本上執行基因體分析
    • 使用 JupyterLab 擴充功能開發無伺服器 Spark 工作負載
  • Python
    • 設定環境
    • 使用 Cloud 用戶端程式庫
  • Trino
  • 部署
  • 執行工作
    • 工作的生命週期
    • 提交工作
    • 重新啟動工作
    • 查看工作記錄
  • 使用工作流程範本
    • 總覽
    • 參數化
    • 使用 YAML 檔案
    • 使用叢集選取器
    • 使用內嵌工作流程
  • 自動化調度管理工作流程
    • 工作流程排程解決方案
    • 使用 Dataproc 工作流程範本
    • 使用 Cloud Composer
    • 使用 Cloud Functions
    • 使用 Cloud Scheduler
  • 調整效能
    • 提升 Spark 效能
    • Dataproc 指標
    • 建立指標快訊
    • 剖析資源使用情況
  • 管理
  • 管理叢集
    • 啟動及停止叢集
      • 手動啟動及停止叢集
      • 排定叢集停止運作時間
    • 更新及刪除叢集
    • 輪替叢集
    • 設定叢集
      • 設定叢集屬性
      • 選取區域
      • 自動選取區域
      • 定義初始化動作
      • 將 VM 類型設為優先順序
      • 排定刪除叢集
    • 調度叢集
      • 調度叢集
      • 自動調度叢集資源
    • 管理資料
      • Hadoop 資料儲存空間
      • 選取儲存空間類型
      • 快取叢集資料
      • 卸載重組資料
    • 管理網路
      • 設定網路
      • 透過 Private Service Connect 建立 Dataproc 叢集網路
  • 管理 Kubernetes 叢集
    • 調度叢集
    • 刪除叢集
  • 存取叢集
    • 使用 SSH
    • 連線至網路介面
    • 使用元件閘道
    • 設定人力資源存取權
  • 管理中繼資料和標籤
    • 啟用 Spark 資料系譜