. #48

wangbingnan136 · 2021-03-18T07:02:11Z

.

ge/models/line.py

shenweichen · 2021-03-23T13:13:22Z

ge/models/line.py

@@ -205,9 +211,13 @@ def get_embeddings(self,):

        return self._embeddings

-    def train(self, batch_size=1024, epochs=1, initial_epoch=0, verbose=1, times=1):
+    def train(self, batch_size=1024, epochs=1, initial_epoch=0, verbose=1, times=1,workers=tf.data.experimental.AUTOTUNE,use_multiprocessing=True):


这里的修改是为什么呀

tf.data.experimental.AUTOTUNE可以让程序自动的选择最优的线程并行个数

当然用户也可以自己选择workers的数量，这里就是做为默认的设定

shenweichen · 2021-03-23T13:14:02Z

ge/models/node2vec.py

-
-
-
-"""


这一大块为啥删除了？

修改的时候直接复制进来，给替换掉了。。。

shenweichen · 2021-03-23T13:14:50Z

ge/models/node2vec.py


-    def train(self, embed_size=128, window_size=5, workers=3, iter=5, **kwargs):
+    def __init__(self, graph, walk_length, num_walks, p=1.0, q=1.0,threads=1):


新的函数参数比旧的少了。。

def init(self, graph, walk_length, num_walks, p=1.0, q=1.0, workers=1, use_rejection_sampling=0):部分的参数移动到train的部分了，use_rejection_sampling 这个木有实现

use_rejection_sampling 如果需要增加这个的numba实现我可以写一下

那相当于把原来有的功能给删除了，这里还是要保持一致的

shenweichen · 2021-03-23T13:17:45Z

ge/models/node2vec.py


    def get_embeddings(self,):
        if self.w2v_model is None:
            print("model not train")
            return {}

        self._embeddings = {}
-        for word in self.graph.nodes():
-            self._embeddings[word] = self.w2v_model.wv[word]
+        for word in self.node_dict.keys():


为什么用self.node_dict替换self.graph?

csrgraph是以scipy形式存储图的，所以节点的名字变成了0，1，2，3.。。。这样的形式，node_dict是networkx和csrgraph之间的节点名字的对应关系，比如原来节点叫“XXX”可能对应的是新的节点名是1这样

shenweichen

ge/models/deepwalk.py 这个文件被你删除了。。
另外看下其他文件的一些修改我有些疑问，麻烦看下

wangbingnan136

因为node2vec的接口已经实现了deepwalk了，所以就把原来deep walk去掉了，当p和q都为1的时候，csrgraph内部会自动选择deepwalk对应的优化游走策略

wangbingnan136 · 2021-03-23T13:27:23Z

ge/models/node2vec.py

-
-
-
-"""


修改的时候直接复制进来，给替换掉了。。。

wangbingnan136 · 2021-03-23T13:28:52Z

ge/models/node2vec.py


-    def train(self, embed_size=128, window_size=5, workers=3, iter=5, **kwargs):
+    def __init__(self, graph, walk_length, num_walks, p=1.0, q=1.0,threads=1):


def init(self, graph, walk_length, num_walks, p=1.0, q=1.0, workers=1, use_rejection_sampling=0):部分的参数移动到train的部分了，use_rejection_sampling 这个木有实现

wangbingnan136 · 2021-03-23T13:29:06Z

ge/models/node2vec.py


-    def train(self, embed_size=128, window_size=5, workers=3, iter=5, **kwargs):
+    def __init__(self, graph, walk_length, num_walks, p=1.0, q=1.0,threads=1):


use_rejection_sampling 如果需要增加这个的numba实现我可以写一下

wangbingnan136 · 2021-03-23T13:31:04Z

ge/models/node2vec.py


    def get_embeddings(self,):
        if self.w2v_model is None:
            print("model not train")
            return {}

        self._embeddings = {}
-        for word in self.graph.nodes():
-            self._embeddings[word] = self.w2v_model.wv[word]
+        for word in self.node_dict.keys():


csrgraph是以scipy形式存储图的，所以节点的名字变成了0，1，2，3.。。。这样的形式，node_dict是networkx和csrgraph之间的节点名字的对应关系，比如原来节点叫“XXX”可能对应的是新的节点名是1这样

wangbingnan136 · 2021-03-23T13:32:16Z

ge/models/line.py

@@ -205,9 +211,13 @@ def get_embeddings(self,):

        return self._embeddings

-    def train(self, batch_size=1024, epochs=1, initial_epoch=0, verbose=1, times=1):
+    def train(self, batch_size=1024, epochs=1, initial_epoch=0, verbose=1, times=1,workers=tf.data.experimental.AUTOTUNE,use_multiprocessing=True):


当然用户也可以自己选择workers的数量，这里就是做为默认的设定

shenweichen · 2021-03-29T14:35:05Z

deepwalk去掉的话会让用户有困惑的。建议保留deepwalk的接口，底层可以调用node2vec

.

4a0ac3a

.

shenweichen reviewed Mar 23, 2021

View reviewed changes

ge/models/line.py Outdated Show resolved Hide resolved

shenweichen reviewed Mar 23, 2021

View reviewed changes

shenweichen requested changes Mar 23, 2021

View reviewed changes

wangbingnan136 commented Mar 23, 2021

View reviewed changes

wangbingnan136 and others added 2 commits July 8, 2021 08:27

update deepwalk

4ea51c3

add example of deepwalk with csrgraph

1fae0a9

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

. #48

. #48

wangbingnan136 commented Mar 18, 2021

shenweichen Mar 23, 2021

wangbingnan136 Mar 23, 2021

wangbingnan136 Mar 23, 2021

shenweichen Mar 23, 2021

wangbingnan136 Mar 23, 2021

shenweichen Mar 23, 2021

wangbingnan136 Mar 23, 2021

wangbingnan136 Mar 23, 2021

shenweichen Mar 29, 2021

shenweichen Mar 23, 2021

wangbingnan136 Mar 23, 2021

shenweichen left a comment

wangbingnan136 left a comment

wangbingnan136 Mar 23, 2021

wangbingnan136 Mar 23, 2021

wangbingnan136 Mar 23, 2021

wangbingnan136 Mar 23, 2021

wangbingnan136 Mar 23, 2021

shenweichen commented Mar 29, 2021


		def train(self, embed_size=128, window_size=5, workers=3, iter=5, **kwargs):
		def __init__(self, graph, walk_length, num_walks, p=1.0, q=1.0,threads=1):




		"""




		"""

. #48

Are you sure you want to change the base?

. #48

Conversation

wangbingnan136 commented Mar 18, 2021

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

shenweichen left a comment

Choose a reason for hiding this comment

wangbingnan136 left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

shenweichen commented Mar 29, 2021