'Tools' 카테고리의 글 목록 (2 Page)

Tools (136)

[ 1 ] [ 2 ] [ 3 ] [ 4 ] [ 5 ] [ ··· ] [ 14 ]

Tools/R

rstudio server 에서 github copilot 사용하기

2024. 4. 26. 20:02

rstudio server 에서 github copilot 사용하기

https://docs.posit.co/ide/user/ide/guide/tools/copilot.html

GitHub Copilot – RStudio User Guide

docs.posit.co

rstudio server 환경에서 github copilot 을 사용하려고 보니 아래처럼

Github Copilot integration has been disabled by the administrator 라는 문구가 떴다.

알아보니, Rstudio Server나 Posit Workbench에서는 관리자 설정 이후 사용이 가능하다고 한다.

관리자 설정 하는 방법은 아래와 같다. rsession.conf 파일을 열고 copilot-enabled=1 문구를 추가해주면 된다!

cd /etc/rstudio/
sudo vim rsession.conf

이렇게 Enable github copilot 옵션이 잘 나온다.

만약 enterprise 환경에서 사용하는 경우, 프록시 서버를 사용하고 있다면 proxy 설정도 해주어야한다.

copilot-proxy-url=<url>

저작자표시 (새창열림)

'Tools > R' 카테고리의 다른 글

R Standard evaluation 과 Tidy evaluation (0)	2024.06.14
R - 롱테일 분포의 히스토그램 그리기 (0)	2024.05.08
R 에서 폰트 사용하는 방법 (linux) (0)	2024.04.04
R - 리스트 문자열을 벡터로 바꾸고 unnest 하기 (0)	2024.03.06
R - dictionary 만들기 (0)	2023.03.15

Tools/R

R 에서 폰트 사용하는 방법 (linux)

2024. 4. 4. 12:52

폰트 다운로드 후 위치 변경

sudo mv [폰트 파일 이름].ttf /usr/share/fonts/truetype/

extrafont 를 이용해 R 환경에 폰트 설치

library(extrafont)
font_import(prompt=FALSE) # 폰트 설치 디렉토리를 검색하여 사용 가능한 폰트를 가져옵니다.
fonts() # 사용 가능한 폰트 목록을 출력합니다.

저작자표시 (새창열림)

'Tools > R' 카테고리의 다른 글

R - 롱테일 분포의 히스토그램 그리기 (0)	2024.05.08
rstudio server 에서 github copilot 사용하기 (0)	2024.04.26
R - 리스트 문자열을 벡터로 바꾸고 unnest 하기 (0)	2024.03.06
R - dictionary 만들기 (0)	2023.03.15
R - 변수 bucketing (카테고리화) (0)	2023.03.10

Tools/R

R - 리스트 문자열을 벡터로 바꾸고 unnest 하기

2024. 3. 6. 15:29

어떤 컬럼의 값이 아래와 같은 문자열로 저장되어있을 때

["2021_12","2022_3","2022_1","2022_12","2023_4"....]

해당 문자열 컬럼을 벡터컬럼으로 바꾸고 해당값을 unnest 하는 예시

하나의 컬럼 값이 벡터형테인 경우 nested 라고 하고, 이를 row 로 변경하는 것을 unnest 라고 한다.

# 문자열 parsing하여 year와 month로 분리하고 각 row로 만들기

df$dates <- lapply(df$month_ids, function(x) {
  unlist(fromJSON(x, simplifyVector = TRUE))
})
df<- df%>% 
  mutate(month_id = map(dates, str_split, pattern = ",")) %>%
  unnest(month_id)

저작자표시 (새창열림)

'Tools > R' 카테고리의 다른 글

rstudio server 에서 github copilot 사용하기 (0)	2024.04.26
R 에서 폰트 사용하는 방법 (linux) (0)	2024.04.04
R - dictionary 만들기 (0)	2023.03.15
R - 변수 bucketing (카테고리화) (0)	2023.03.10
R - lag 변수 만들기 (0)	2023.03.10

Tools/R

R - dictionary 만들기

2023. 3. 15. 18:59

List 를 이용한 방법

# dictionary 생성
dict <- list(name = "John", age = 30, city = "New York")

# dictionary 사용
dict$name
# [1] "John"

dict$age
# [1] 30

dict$city
# [1] "New York"

vector 를 활용한 방법

ㄴ setNames 함수를 활용

# dictionary 생성
dict <- setNames(c("John", 30, "New York"), c("name", "age", "city"))

# dictionary 사용
dict$name
# [1] "John"

dict$age
# [1] 30

dict$city
# [1] "New York"

hash 함수를 활용한 방법

library(hash)
h <- hash() 
h[['a']] <- 'a'
h[['b']] <- 'b'
h[['c']] <- 'c'
h[['d']] <- 'd'

h[['a']]

저작자표시 (새창열림)

'Tools > R' 카테고리의 다른 글

R 에서 폰트 사용하는 방법 (linux) (0)	2024.04.04
R - 리스트 문자열을 벡터로 바꾸고 unnest 하기 (0)	2024.03.06
R - 변수 bucketing (카테고리화) (0)	2023.03.10
R - lag 변수 만들기 (0)	2023.03.10
R - 반복문 대신 사용하는 lapply 패턴 (0)	2023.03.10

Tools/R

R - 변수 bucketing (카테고리화)

2023. 3. 10. 14:47

R 에서 특정 변수를 카테고리화 하고 싶을 때가 많다.

다양한 방법이 있지만,

아래 cut 함수를 사용하는 코드로 0~5, 6~10, 11~15, ... >100 으로 카테고리화가 가능하다.

cat <- seq(0,100,5)
df$cat <- cut(df$x, breaks = c(cat, Inf), labels = cat)
df$cat <- factor(df$cat, levels=cat)

-> breaks 의 element 보다 labels 의 elements 의 갯수가 1개 적다.

좀 더 일반적으로는 다음과 같다.

# 예시 데이터 생성
set.seed(123)
data <- data.frame(id = 1:10, value = rnorm(10, mean = 50, sd = 10))

# 카테고리화
data$cat <- cut(data$value, breaks = c(0, 25, 50, 75, 100), labels = c("low", "medium-low", "medium-high", "high"))

mutate_at 을 이용해서 아래와 같이 일괄적으로 cut 함수를 여러 컬럼에 적용할 수 있다.

data <- data %>%
  mutate_at(vars(a, b, c), 
            list(cat = ~cut(., 
                            breaks = c(0, 25, 50, 75, 100),
                            labels = c("0", "1", "2", "3"),
                            include.lowest = TRUE)))

저작자표시 (새창열림)

'Tools > R' 카테고리의 다른 글

R - 리스트 문자열을 벡터로 바꾸고 unnest 하기 (0)	2024.03.06
R - dictionary 만들기 (0)	2023.03.15
R - lag 변수 만들기 (0)	2023.03.10
R - 반복문 대신 사용하는 lapply 패턴 (0)	2023.03.10
R - na to zero (0)	2023.03.09

Tools/R

R - lag 변수 만들기

2023. 3. 10. 04:03

Hmisc 의 Lag 변수를 통해 timeseries 데이터의 lag 변수를 만들 수 있다.

만약, 그룹별 Lag 변수를 만들고 싶으면 dplyr group_by 를 통해 만들 수 있다.

library(Hmisc)
data <- data %>% group_by(gender, age) %>% mutate(lag = Lag(variable, 1))

저작자표시 (새창열림)

'Tools > R' 카테고리의 다른 글

R - dictionary 만들기 (0)	2023.03.15
R - 변수 bucketing (카테고리화) (0)	2023.03.10
R - 반복문 대신 사용하는 lapply 패턴 (0)	2023.03.10
R - na to zero (0)	2023.03.09
R - 컬럼별 동일한 함수 적용을 위한 lapply 테크닉 (0)	2022.09.05

Tools/R

R - 반복문 대신 사용하는 lapply 패턴

2023. 3. 10. 03:44

반복문을 돌면서 여러개의 dataframe 을 만들고,

이것들을 합쳐서 최종적인 결과 dataframe 을 만드는 경우 아래와 같이 함

brand_names <- c("BBQ", "BHC")
tmp_dfs <- lapply(brand_names, function(x){
  p <- paste0(x, "_payment")
  b <- paste0(x, "_buzz")
  tmp_df[1, 'brand'] <- x
  tmp_df[1, 'cor'] <- cor.test(merged[,p], merged[,b])$estimate
  tmp_df
})

df_result <- bind_rows(tmp_dfs)
df_result

출력
> df_result
        cor brand
1 0.6971354   BBQ
2 0.4675438   BHC

저작자표시 (새창열림)

'Tools > R' 카테고리의 다른 글

R - 변수 bucketing (카테고리화) (0)	2023.03.10
R - lag 변수 만들기 (0)	2023.03.10
R - na to zero (0)	2023.03.09
R - 컬럼별 동일한 함수 적용을 위한 lapply 테크닉 (0)	2022.09.05
R - aggregate / separate_rows (0)	2022.06.21

Tools/R

R - na to zero

2023. 3. 9. 22:39

모든 na값을 0로 바꾸기

df[is.na(df)] <- 0

특정 컬럼의 na 값을 0으로 바꾸기

df[is.na(df$col_name), 'col_name'] <- 0

여러 컬럼의 na 값을 0으로 바꾸기

impute_var <- c('a','b','c')
df[impute_var][is.na(df[impute_var])] <- 0

저작자표시 (새창열림)

'Tools > R' 카테고리의 다른 글

R - lag 변수 만들기 (0)	2023.03.10
R - 반복문 대신 사용하는 lapply 패턴 (0)	2023.03.10
R - 컬럼별 동일한 함수 적용을 위한 lapply 테크닉 (0)	2022.09.05
R - aggregate / separate_rows (0)	2022.06.21
R - 난수 생성을 일별로 변경하기 (0)	2022.06.21

Tools/Python

Pyspark export to delimited file

2022. 11. 15. 18:05

Pyspark export to delimited file

def myConcat(*cols):
    concat_columns = []
    for c in cols[:-1]:
        concat_columns.append(F.coalesce(c, F.lit("*")))
        concat_columns.append(F.lit("\t"))  
    concat_columns.append(F.coalesce(cols[-1], F.lit("*")))
    return F.concat(*concat_columns)

# combined column 에 모든 변수를 \t 로 concat 한 값 저장 
data_text = data.withColumn("combined", myConcat(*data.columns)).select("combined")
data_text.coalesce(1).write.format("text").option("header", "false").mode("overwrite").save(path)

출처 : https://stackoverflow.com/questions/17837871/how-to-copy-file-from-hdfs-to-the-local-file-system

저작자표시 (새창열림)

'Tools > Python' 카테고리의 다른 글

Jupyter notebook에서 외부 파일을 자동으로 갱신하는 방법 (0)	2022.10.19
Pyspark MLlib 를 활용한 모델링 기초 (w/ Random Forest) (0)	2022.09.20
PySpark DataFrame 을 이용한 탐색적 데이터 분석 및 처리 (0)	2022.08.26
PySpark DataFrame 을 사용하는 이유와 pandas 와의 차이점 (0)	2022.08.26
아나콘다 python 3 가상환경 세팅하기 (0)	2022.06.12

Tools

Git ignore 가 적용되지 않을때

2022. 10. 20. 11:35

가끔 .gitignore 파일에 올리고 싶지 않은 파일이나 폴더를 지정후, remote repo 에 push 를 해도 적용되지 않을 때가 있다.

이 때는 캐시를 지우고 시도한다.

git rm --cached -r .
git add .

저작자표시 (새창열림)

Deepplay interested in data analytics and ML modeling

admin write link

notice

블로그 운영 정보

my link

statistics

total :
today :
yesterday :

Tools (136)

Tools/R

rstudio server 에서 github copilot 사용하기

rstudio server 에서 github copilot 사용하기

'Tools > R' 카테고리의 다른 글

Tools/R

R 에서 폰트 사용하는 방법 (linux)

'Tools > R' 카테고리의 다른 글

Tools/R

R - 리스트 문자열을 벡터로 바꾸고 unnest 하기

'Tools > R' 카테고리의 다른 글

Tools/R

R - dictionary 만들기

'Tools > R' 카테고리의 다른 글

Tools/R

R - 변수 bucketing (카테고리화)

'Tools > R' 카테고리의 다른 글

Tools/R

R - lag 변수 만들기

'Tools > R' 카테고리의 다른 글

Tools/R

R - 반복문 대신 사용하는 lapply 패턴

'Tools > R' 카테고리의 다른 글

Tools/R

R - na to zero

'Tools > R' 카테고리의 다른 글

Tools/Python

Pyspark export to delimited file

'Tools > Python' 카테고리의 다른 글

Tools

Git ignore 가 적용되지 않을때

notice

category

recent posts

recent comments

tag cloud

my link

statistics

티스토리툴바