spark-submit --class com.aliyun.emr.examples.TestOss --executor-memory 2G --total-ex

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

example例子的运行 about aliyun-emapreduce-datasources HOT 4 CLOSED

shengnoah commented on August 14, 2024

example例子的运行

from aliyun-emapreduce-datasources.

Comments (4)

uncleGen commented on August 14, 2024

@shengnoah 可以，你打包时只要将sdk的jar打进去。

例如：
             <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-shade-plugin</artifactId>
                <configuration>
                    <shadedArtifactAttached>false</shadedArtifactAttached>
                    <outputFile>${project.build.directory}/shaded/emr-examples_2.10-${project.version}.jar</outputFile>
                    <artifactSet>
                        <includes>
                            <include>com.aliyun:emr-sdk_2.10</include>
                            <include>com.aliyun:emr-core</include>
                        </includes>
                    </artifactSet>
                </configuration>
                <executions>
                    <execution>
                        <phase>package</phase>
                        <goals>
                            <goal>shade</goal>
                        </goals>
                    </execution>
                </executions>
            </plugin>

from aliyun-emapreduce-datasources.

shengnoah commented on August 14, 2024

有一个想法，就是的例子，如果能统一

用这种：
val conf = new SparkConf().setAppName("Test OSS")
conf.set("spark.hadoop.fs.oss.accessKeyId", accessKeyId)
conf.set("spark.hadoop.fs.oss.accessKeySecret", accessKeySecret)
conf.set("spark.hadoop.fs.oss.endpoint", endpoint)
conf.set("spark.hadoop.fs.oss.impl", "com.aliyun.fs.oss.nat.NativeOssFileSystem")

或者统一下：

val ossData = OssOps(sc, endpoint, accessKeyId, accessKeySecret).readOssFile(inputPath, numPartitions)

因为readme.md说明里用了conf.set,有的项目set了，有的没有set。或是多一个少一个。

像example里TestOss的代码，就一个conf.set 也没有。

其实意思都能明白，有时候被绕进去了。

多谢解答！
如果不能独立，把SDK放进去也可以。

from aliyun-emapreduce-datasources.

uncleGen commented on August 14, 2024

@shengnoah 第一种可以直接用spark提供的sc.textFile(...)，可能更好接受些。提供OssOps实际上和其他例如ODPS等接口保持一种统一风格。对于OSS来说这两种都可以，看你个人的选择。

from aliyun-emapreduce-datasources.

shengnoah commented on August 14, 2024

@uncleGen 收到，多谢！

from aliyun-emapreduce-datasources.

Recommend Projects

example例子的运行 about aliyun-emapreduce-datasources HOT 4 CLOSED

Comments (4)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent