반업주부의 일상 배움사

[요약] 상남자 특) 트위터 소스코드 깃헙에 공개함 :: with AI 본문

IT 인터넷/일반

[요약] 상남자 특) 트위터 소스코드 깃헙에 공개함 :: with AI

Banjubu 2023. 4. 5. 17:26
반응형


> English Summary

 

[ 요약 ]

일론 머스크는 트위터의 소스코드를 깃허브에 공개하였고, 이를 기념하여 트위터 로고도 일론 머스크가 도지로 받았습니다.
공개된 것은 트윗 추천 알고리즘에 대한 일부분으로, 이는 비즈니스의 핵심이라 미국에서 일론 머스크는 신으로 불리고 있습니다.
개발자들은 이를 구경할 수 있는 좋은 기회를 가졌으며, 소스코드를 열람해 수정하는 사람도 있지만, 수정 권한은 트위터가 가지고 있습니다.
대부분의 파일은 스칼라 언어로 작성되어 있으며 자바와 호환이 잘됩니다.
이슈나 풀 리퀘스트를 올릴 수 있으나 수정 권한은 트위터가 가지고 있기 때문에 문제가 될 것은 없습니다.
해당 소스 코드는 자바스크립트로 작성된 것으로, 홈 화면에 띄울 트윗을 선별할 때는 주제에 따라 감점 또는 가산점이 부여되며, 인터랙션에 따라 점수가 부여된다는 내용이 있습니다.
또한, 스팸 요소가 있는 링크를 딸랑 넣을 경우 스팸 점수가 매겨질 수 있으니, 주의가 필요합니다.
이에 대한 자세한 정보는 소스 코드 내에서 확인할 수 있습니다.
읽는 분들께서는 필요한 내용을 여러 번 읽어 이해하시고, 코드를 숙지한 후 사용해보시면 좋을 것입니다.
해당 파라미터들을 고려하여 선정하는 것을 확인할 수 있습니다.
하지만 이러한 지표들이 실제로 적용되는지는 아직 알 수 없으며, 맹신하지 말고 대략적으로 이해하면 됩니다.
또한, 추천 알고리즘이 어떤 스텝으로 진행되는지 파일에 설명이 달려 있습니다.
트위터에서 하루에 5억 개의 트윗 중 메인 피드에 띄워질 트윗을 고르는 과정이 있으며, 평균적으로 1단계를 거칩니다.
이에 대해 확인 및 이해 부탁드립니다.
설명하자면, 트위터에 접속 시 1500개의 트윗 중 팔로잉하는 계정들의 트윗과 팔로잉하지 않는 계정들의 트윗을 가져오게 됩니다.
팔로잉하지 않는 사람들의 트윗은 팔로우한 사람이 좋아요한 것들과 유사한 사람들이 좋아요한 것들도 가져오며, 클러스터링이라는 방법을 사용하여 유사한 사람들을 분류합니다.
이렇게 커뮤니티에서 관심사와 일치하는 트윗들을 뽑아서 딥러닝 모델에 넣어 점수를 매기는 것입니다.
따라서, 이 방식을 이용해 트위터에서 최적의 트윗을 추천합니다.
딥 러닝 모델은 고객들로부터 많은 좋아요, 리트윗, 답글을 받을 수 있는 트윗을 찾아 높은 점수를 부여하는 모델입니다.
1500개의 트윗 중에서 높은 점수를 받은 것들을 보여주는데, 우선적으로 블락한 것들과 중복적인 내용을 필터링 과정을 거칩니다.
추천 알고리즘은 컨텐츠 기업에서 필수적으로 요구되는데, 아직까지 수작업으로 관리하는 것이 많습니다.
이러한 모델을 개선하여 비용을 절약하고 수작업의 필요성을 줄일 수 있으며, 머스크가 더 많은 공개할 것이 있다고 합니다.

 

반응형

 

 

 

Contributed to Twitter's source code on GitHub

https://www.youtube.com/watch?v=zJI4bgEJ8IU 

 

 



 

[ Summary ]

Elon Musk released Twitter's source code to GitHub, and in honor of the occasion, the Twitter logo was doodled by Elon Musk.
What was revealed was part of the tweet recommendation algorithm, which is so central to the business that Elon Musk is a god in the United States.
Developers have had a great opportunity to take a look at it, and some have taken a look at the source code and made modifications, but Twitter has the right to do so.
Most of the files are written in scalar language and are very compatible with Java.
You can raise an issue or a pull request, but since Twitter has modification rights, it shouldn't be a problem.
The source code is written in JavaScript, and it says that when selecting tweets for the home screen, points are deducted or added based on topic, and points are awarded based on interaction.
It's also worth noting that dropping in links with spammy elements can result in a spam score, so be careful.
More information on this can be found within the source code.
We recommend that you read it several times to make sure you understand what you need to know, and to familiarize yourself with the code before trying it out.
You can see that it takes these parameters into account.
However, we still don't know if these metrics actually apply in practice, so don't trust them, just get a rough idea.
The file also explains what steps the recommendation algorithm goes through.
There is a process of selecting the Tweets that will appear in the main feed out of the 500 million Tweets we see per day, and on average it takes 1 step.
Please check and understand this.
To explain, when you go to Twitter, it pulls in 1500 Tweets from accounts you follow and Tweets from accounts you don't follow.
The Tweets from people you don't follow are liked by people who are similar to the people you follow, and we use a method called clustering to categorize similar people.
The idea is to pull tweets from your community that match your interests and feed them into a deep learning model to score them.
This is how Twitter recommends the best Tweets for you.
The deep learning model looks for Tweets that are likely to get a lot of likes, retweets, and replies from customers and gives them a high score.
It shows you the top scoring tweets out of 1500, first filtering out blockers and duplicates.
Recommendation algorithms are essential for content companies, but they are still largely managed manually.
Improving these models can save money and reduce the need for manual labor, and Musk says he has more to reveal.

 

 

 

 


#ElonMusk #Twitter #Source code #GitHub #Logo #Tweets #Suggestions #Business #Core #Developer #Scalar #JavaScript #JavaScript #Home #Scoring #Scoring Points #Interaction #Spam #Links #Parameters #Metrics #Tweet Selection #Mainfeed #Clustering #Deep Learning Model #Optimal Tweets #Blocks #Filtering #Improve Recommendation Algorithms #Cost Savings #Handwork

#일론머스크 #트위터 #소스코드 #깃허브 #로고 #트윗 #추천알고리즘 #비즈니스 #핵심 #개발자 #스칼라언어 #자바 #수정권한 #자바스크립트 #홈화면 #감점 #가산점 #인터랙션 #스팸 #링크 #파라미터 #지표 #트윗선정 #메인피드 #클러스터링 #딥러닝모델 #최적의트윗 #블락 #필터링 #추천알고리즘개선 #비용절감 #수작업

반응형
LIST
Comments