注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
您可以在代码库中的 transforms-python/build.gradle 中取消注释与检查相关的行。这将启用一个 linting 任务,该任务将提供对 pep8 或 pylint 格式规则违规的提示。
时间戳: 2024年6月12日
可以通过启用动态分配来实现执行器的自动扩展,这允许执行器的自动扩展,但不包括执行器/驱动器内存。具体配置文件如 DYNAMIC_ALLOCATION_MAX_64 和 DYNAMIC_ALLOCATION_ENABLED 配置文件支持此功能。更多信息和内置动态分配配置的配置文件列表可以在 Spark 配置文件参考文档 中找到。
时间戳: 2024年4月5日
在提交代码时选择 提交前格式化 选项,将运行 formatCode 任务。此任务可以使用 ruff 或 black 作为格式化程序。可以通过取消注释 transforms-python/build.gradle 文件中与格式化程序相关的行来控制。
时间戳: 2024年6月12日
No module named <module-name>; <package-name> is not a package?要排查和解决导入错误,请按照以下步骤操作:
时间戳: 2024年4月25日
pandas 数据帧的正确方法是什么?要写入 pandas 数据帧,您应该使用 .write_pandas() 方法。如果您遇到 AttributeError: 'DataFrame' object has no attribute '_jdf' 错误,这意味着您正在对 pandas 数据帧使用为 pyspark 数据帧设计的方法。
时间戳: 2024年5月30日