注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
您可以在代码库中的 transforms-python/build.gradle
中取消注释与检查相关的行。这将启用一个 linting
任务,该任务将提供对 pep8
或 pylint
格式规则违规的提示。
时间戳: 2024年6月12日
可以通过启用动态分配来实现执行器的自动扩展,这允许执行器的自动扩展,但不包括执行器/驱动器内存。具体配置文件如 DYNAMIC_ALLOCATION_MAX_64 和 DYNAMIC_ALLOCATION_ENABLED 配置文件支持此功能。更多信息和内置动态分配配置的配置文件列表可以在 Spark 配置文件参考文档 中找到。
时间戳: 2024年4月5日
在提交代码时选择 提交前格式化 选项,将运行 formatCode
任务。此任务可以使用 ruff
或 black
作为格式化程序。可以通过取消注释 transforms-python/build.gradle
文件中与格式化程序相关的行来控制。
时间戳: 2024年6月12日
No module named <module-name>; <package-name> is not a package
?要排查和解决导入错误,请按照以下步骤操作:
时间戳: 2024年4月25日
pandas
数据帧的正确方法是什么?要写入 pandas
数据帧,您应该使用 .write_pandas()
方法。如果您遇到 AttributeError: 'DataFrame' object has no attribute '_jdf'
错误,这意味着您正在对 pandas
数据帧使用为 pyspark
数据帧设计的方法。
时间戳: 2024年5月30日