Git Product home page Git Product logo

Comments (14)

Dguipla avatar Dguipla commented on July 28, 2024

Gracias !!

Una pregunta en el build.sbt https://github.com/mjuez/sbt_scala_spark_hello_world/blob/main/build.sbt
¿tenria que incluir también el componente ml (sparkComponents += "ml") ?

from tfm-semisup.

alvarag avatar alvarag commented on July 28, 2024

Sí, porque es una dependencia que tienes

from tfm-semisup.

Dguipla avatar Dguipla commented on July 28, 2024

Es raro pero estoy intentado entender porque me da este error (Error downloading org.apache.spark:spark-ml_2.12:3.0.1) cuando añado ml (con mllib me genera el .jar)...

from tfm-semisup.

alvarag avatar alvarag commented on July 28, 2024

¿Te da el problema con tu repositorio o con el que te ponía de ejemplo?

from tfm-semisup.

Dguipla avatar Dguipla commented on July 28, 2024

Al añadir el paquete --> sparkComponents += "ml” no me genera el .jar me da error dice que no lo encuentra…

Si no le pongo este paquete no me da error y me genera el .jar para la clase SelfTraining.

He estado buscando y no hay mucha información al respecto, pero en todos los casos que he visto solo ponen "mllib" en sparkComponents, no sé si con esta dependencia es suficiente he indirectamente también tiene en cuenta "ml". De todas maneras, cuando cargo la librería .jar que me genera con solo mllib en DataBricks tampoco me deja hacer un import me sale error.
Lo hablamos el lunes y os comento mejor.

from tfm-semisup.

alvarag avatar alvarag commented on July 28, 2024

Para hacer la prueba de si te funciona o no, probar con una instalación local de Spark. Ejecutar el script spark-shell con --jars

./spark-shell --jars pathOfjarsWithCommaSeprated

from tfm-semisup.

Dguipla avatar Dguipla commented on July 28, 2024

Tenía un problema con la ruta donde se encontraba la clase (es decir que me compilaba una clase vacía, sin nada...)

image.png

Ahora me indica que no conoce el $. En DataBricks hacia un import de sqlContext.implicits._ pero aquí no me funciona.
Por otro lado, en la clase SelfTraining trabajo con otra clase SemiSupervisedDataResults que tendría que estar previamente generada para poder importarla a SelfTraining.

@alvarag, quizá seria mejor y más rápido hablarlo via Teams. ¿Tendrías algún hueco durante la semana ?

PD: Esta subido en Github.

from tfm-semisup.

alvarag avatar alvarag commented on July 28, 2024

Si te va bien podríamos quedar mañana por la tarde a las 16:30, por ejemplo.

El import de sqlImplicits debes hacerlo dentro de la clase y no fuera con los otros imports. Es un poco raro el import para que funcione la $-notation, pero deberías ponerlo en el interior de la definición de la clase. En tu caso en la línea 20 por ejemplo.

from tfm-semisup.

alvarag avatar alvarag commented on July 28, 2024

En cuanto al error que te da por "SemiSupervisedDataResults" es porque dicha clase no la tienes definida. Supongo que estará en otro fichero que no esta subida o esta en otra ruta

from tfm-semisup.

Dguipla avatar Dguipla commented on July 28, 2024

@alvarag Perfecto mañana a las 16:30.
Por otro lado el error relacionado con "SemiSupervisedDataResults" esta solucionado era porque no estaba subido el archivo, de lo contrario no consigo eliminar el de sqlImplicits, he probado con:

import org.apache.spark.sql.SQLImplicits
import sqlContext.implicits._
import spark.implicits._

y creo que alguno más... todos ellos dentro de la clase pero no consigo que me funcione...

from tfm-semisup.

alvarag avatar alvarag commented on July 28, 2024

Para poder importar implicits necesitas tener primero una referencia al objeto SparkSession.

En la funcioón/método que necesites utilizar la $-notation debes poner lo siguiente:

val sql = sparkSession
import sql.implicits._

from tfm-semisup.

alvarag avatar alvarag commented on July 28, 2024

Lo tengo @Dguipla , importa arriba como tenías:

import org.apache.spark.sql.{SparkSession, SQLContext}

Luego abajo donde tenías el val sql... pon:

val sql = SparkSession.builder().getOrCreate()

from tfm-semisup.

Dguipla avatar Dguipla commented on July 28, 2024

Lo acabo de probar y perfecto también lo he probado en Spark y funciona :

image.png

from tfm-semisup.

Dguipla avatar Dguipla commented on July 28, 2024

@alvarag @jjrodriguez ya he modificado el nombre de la columna label, para el Self-Training y Co-Training ahora por defecto es "label".

Por otro lado también he corregido el error con el plugins.sbt . He generado el .jar y funciona clonando el proyecto de Gihub.

Si lo probais tendria que funcionar, si no me deciis...

from tfm-semisup.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.