Tag: cassandra

卡桑德拉连接空转和超时

我试图使用python驱动来加载和删除Cassandra的数据。 我已经尝试了这两个使用cassandra运行在docker集装箱,并在docker版本给我的问题后本地再次。 以下是我正在做的一个例子: class Controller(object): def __init__(self): self.cluster = Cluster() self.session = self.cluster.connect('mykeyspace') def insert_into_cassandra(self): query = ('INSERT INTO mytable (mykey, indexed_key) VALUES (?, ?)') prepared = self.session.prepare(query) prepared.consistency_level = ConsistencyLevel.QUORUM params_gen = self.params_generator(fname) execute_concurrent_with_args(self.session, prepared, self.parameter_generator(), concurrency=50) def delete_param_gen(self, results): for r in results: yield [r.mykey] def delete_by_index(self, value): query = "SELECT mykey from […]

在cassandra中生成的导出csv文件的默认目录在哪里?

我使用Cassandra COPY命令将数据导出到csv文件。 cqlsh > COPY music.songs to 'songs.csv'; 我不知道在哪里可以find导出的csv文件。 我在Wins7运行的Docker使用Cassandra 。

连接拒绝cassandra和docker-py的错误

所以基本上我试图运行一个cassandradocker实例(2.1),并按照https://hub.docker.com/_/cassandra/中的说明运行cqlsh命令。 $ docker run –name some-cassandra -d cassandra:2.1 $ docker run -it –link some-cassandra:cassandra –rm cassandra sh -c 'exec cqlsh "$CASSANDRA_PORT_9042_TCP_ADDR"' 要么 $ docker run -it –link some-cassandra:cassandra –rm cassandra cqlsh cassandra 手动一切正常工作正常,但是当试图用docker-py自动化这个stream程时,我遇到了运行cqlsh shell的问题。 我无法执行cqlsh shell,并对我的链接容器运行的cassandra docker容器运行命令。 下面,我已经提供了代码和我得到的各种命令组合的响应,我试图让cqlsh shell工作。 任何提示/build议/答案是高度赞赏。 这是我正在使用的代码。 import docker host_config = client.create_host_config(port_bindings={ 9042: 9042, 7199: 7199, 7001: 7001 } ) ctr […]

用opscenterpipe理docker上的cassandra数据库

我有一个在Docker上运行的cassandra实例,我想知道(如果可能)使用datastax opscenter监视cassandra实例。 为了达到我的cassandra实例,我运行: $ docker run -it –rm cassandra:3.0.2 bash $ cqlsh [MY_HOST] -u USERNAME -p PASSWORD 安装opscenter我不知道要放在这里:

Docker容器A在作为另一个Docker服务B运行的cassandra中查询(插入/更新)之后死亡

我是docker工人卡桑德拉。 以及我正面临一个奇怪的问题,任何帮助,因为我可以debugging这个问题将是伟大的。 我在用 Cassandra 3.3.0, native Cassandra-driver for python- 3.3.0 Docker 1.11.1 我有两个容器一个托pipecassandra服务说容器A和从另一个容器说B我正在执行插入查询cassandra容器。 这里一旦B对这个容器B(这是我的服务容器)死后刚刚执行查询。 我在容器B中看到的日志 [start] application exit with code 0, killing container 我没有看到任何其他相关的日志进一步debugging是什么原因,以便我的容器插入后死亡。 只是为了确保我不会丢失任何exception,我正在捕获所有exception即BaseException。 我已经添加了几个logging器来跟踪我的问题,但即使是容器死亡,它永远不会来到这个除了块。 我怀疑 看起来docker在内存中有错误,它会写,它死或别的东西。 我也试过 我试图运行我的代码没有docker容器看到有问题的线路,如果有的话。 这里没有docker工作,没有例外。 我也确保closurescassandra会话。 请指教 ..

无法在Spark上运行Docker上的Cassandra

我有一个在Docker上运行的Zeppelin笔记本。 我有以下代码使用Cassandra: import org.apache.spark.sql.cassandra._ val cqlContext = new CassandraSQLContext(sc) cqlContext.sql("select * from demo.table").collect.foreach(println) 但是,我得到这个错误: import org.apache.spark.sql.cassandra._ cqlContext: org.apache.spark.sql.cassandra.CassandraSQLContext = org.apache.spark.sql.cassandra.CassandraSQLContext@395e28a8 com.google.common.util.concurrent.UncheckedExecutionException: java.lang.IllegalArgumentException: Cannot build a cluster without contact points at com.google.common.cache.LocalCache$Segment.get(LocalCache.java:2199) at com.google.common.cache.LocalCache.get(LocalCache.java:3932) at com.google.common.cache.LocalCache.getOrLoad(LocalCache.java:3936) at com.google.common.cache.LocalCache$LocalLoadingCache.get(LocalCache.java:4806) at org.apache.spark.sql.cassandra.CassandraCatalog.lookupRelation(CassandraCatalog.scala:28) at org.apache.spark.sql.cassandra.CassandraSQLContext$$anon$2.org$apache$spark$sql$catalyst$analysis$OverrideCatalog$$super$lookupRelation(CassandraSQLContext.scala:219) at org.apache.spark.sql.catalyst.analysis.OverrideCatalog$$anonfun$lookupRelation$3.apply(Catalog.scala:137) at org.apache.spark.sql.catalyst.analysis.OverrideCatalog$$anonfun$lookupRelation$3.apply(Catalog.scala:137) at scala.Option.getOrElse(Option.scala:120) at org.apache.spark.sql.catalyst.analysis.OverrideCatalog$class.lookupRelation(Catalog.scala:137) at org.apache.spark.sql.cassandra.CassandraSQLContext$$anon$2.lookupRelation(CassandraSQLContext.scala:219) at org.apache.spark.sql.catalyst.analysis.Analyzer$ResolveRelations$$anonfun$apply$5.applyOrElse(Analyzer.scala:143) at org.apache.spark.sql.catalyst.analysis.Analyzer$ResolveRelations$$anonfun$apply$5.applyOrElse(Analyzer.scala:138) […]

SELECT错误Cassandra的“行”对象没有属性“值”

我试图在我的本地docker( https://hub.docker.com/_/cassandra/ )中设置和运行Cassandra 3.10。 一切顺利,直到我尝试从一个表中select。 这是我每次运行时所得到的错误select any what: 'Row' object has no attribute 'values' 我遵循的步骤是: 我使用默认超级用户cassandra创build了一个新的密钥空间。 keyspace test with replication = {'class':'SimpleStrategy','replication_factor' : 2};创buildkeyspace test with replication = {'class':'SimpleStrategy','replication_factor' : 2}; 和USE test; 我创build了一个新表: create table usertable (userid int primary key, usergivenname varchar, userfamilyname varchar, userprofession varchar); 插入一些数据: insert into usertable (userid, usergivenname, userfamilyname, userprofession) […]

单节点Cassandra集群的局限性是什么?

我正在试验Cassandra和Opscenter。 在Opscenterd的日志文件中,我find了这一行 错误:调用CreateClusterConfController(SingleNodeProvisioningError)时出现问题:由于单节点群集的限制,OpsCenter将无法与Datastax代理进行通信,除非列表en_address / broadcast_address在cassandra.yaml中设置为172.17.42.1。 继续之前请确保这些匹配。 因为我在不同的Docker容器中部署了Cassandra和Opscenter,所以我必须将listen_address设置为容器的内部IP(因为坐在容器中的Cassandra对它的主机一无所知)并将broadcast_address设置为相应主机的桥IP。 如果您将Cassandra部署在独立网关后面的计算机上(如AWS EC2,其中每个实例都有私有IP和公有IP),则这是正常的设置。 问题1 :单节点集群的局限性究竟是什么? 问题2 :在这种情况下我应该如何解决这个问题? 谢谢

Python无法通过Docker连接到Cassandra

我已经能够在Windows本地主机端口上启动Cassandra,并使用cassandra-driver模块连接到它。 但是,当我尝试通过Docker容器连接到Cassandra时,我收到以下连接拒绝exception: cassandra.cluster.NoHostAvailable: ('Unable to connect to any servers', {'192.168.99.101': ConnectionRefusedError(10061, "Tried connecting to [('192.168.99.101', 9042)]. Last error: No connection could be made because the target machine actively refused it")}) 这是我的设置: 系统: Windows 8.1 Docker 1.9.1 Virtualbox 4.3.34 Python 3.5.1 Cassandra 3.0.2 Cassandra-Driver 3.0.0 Dockerfile: https ://hub.docker.com/r/rc42/lab-cassandra/~/dockerfile/ docker集装箱港口映射: 7000/tcp -> 0.0.0.0:7000 7001/tcp -> 0.0.0.0:7001 7199/tcp […]

Hadoop和Cassandra基准testing

我最近build了一个Hadoop – Cloudera cluster和Cassandra集群,有2个节点。 我想现在做一些基准testing,收集一些关于资源使用情况的数据。 我search了很多,findHiBench和Cassandra压力工具。 我不想和其他系统比较,我想自己摸索一下,但很难想象,我怎么才能得到真正正确的价值。 集群由2个虚拟机组成,由KVM创build。 Cassandra在Docker容器中。 很难解释,如何分析这个系统,没有得到错误的结果。